You can edit almost every page by Creating an account. Otherwise, see the FAQ.

HASQUE

Aus EverybodyWiki Bios & Wiki
Wechseln zu:Navigation, Suche

HASQUE (Hearing Adequate Signal Quality Evaluation) ist ein Hörtestsimulator zur gehöradäquaten (~berichtigten) objektiven Qualitätsbeurteilung von Audio - und Telekommunikationssystemen.

Entwicklung[Bearbeiten]

Mit Hilfe der Forschungsergebnisse von Eberhard Zwicker waren die Grundregeln für eine Nachbildung der Höreigenschaften gegeben. Unter anderem war die korrekte Nachbildung der im Innenohr (Cochlea) stattfindenden Frequenz-Ortstransformation eine Herausforderung für die Entwicklung neuer Algorithmen, da die Frequenz-/ Zeitauflösung des menschlichen Ohres mit bekannten Verfahren wie der schnellen Fourier-Transformation (FFT) oder Bandbreitenfiltern nicht korrekt nachgebildet werden konnte.

So wurde eine gleitende Spektralanalyse schon Mitte der 1990er Jahre für eine bessere Zeitauflösung vorgeschlagen. Im Laufe der folgenden Jahre wurden die BARK–Transformation und die CFT für eine bessere Nachbildung der Frequenz-Ortstransformation mit gehöradäquater Frequenz- und Zeitauflösung entwickelt.   

Basierend auf der CFT begann die Entwicklung des HASQUE-Verfahrens im Jahr 2003, nachdem sich innerhalb der Internationale Fernmeldeunion (ITU) keine brauchbare Lösung zur gehöradäquaten Qualitätsbeurteilung von Geräuschreduktionsverfahren abzeichnete und die Qualitätsbeurteilung von Signalen mit Hintergrundgeräuschen mit bekannten Verfahren nicht befriedigend durchgeführt werden konnte. HASQUE wurde in 2005 zum Patent angemeldet und durch Erfahrungen mit verschiedenen Anwendungen aus den Bereichen PC-Multimedia, Abwehrtechnik (akustische Ortung), Telekommunikation (Bewertung von Verfahren zur Geräuschreduktion, Bandbreitenerweiterung, Sprachcodecs) und Studiotechnik (Bewertung von TV-Werbespots) in Zusammenarbeit mit mittleren und großen Unternehmen kontinuierlich verbessert.

Hörtestsimulation mit HASQUE[Bearbeiten]

Die Nachbildung der Höreigenschaften des menschlichen Ohres wird bei HASQUE durch eine sogenannte Cochleatransformation im gesamten zur Verfügung stehenden Frequenzbereich ohne Bandbreitenbegrenzung durchgeführt. Der Name „Cochleatransformation“ wurde gewählt, da in der Cochlea im Innenohr wesentliche Höreigenschaften mit bestimmt werden. Die Frequenz-Ortstransformation arbeitet mit optimierter Zeit-/Frequenzauflösung. Maskierungseffekte werden durch gehöradäquate Algorithmen im Zeit- und Frequenzbereich nachgebildet. Die Mithörschwelle wird an das Hintergrundgeräusch der zu bewertenden Systeme in Abhängigkeit der Geräuscheigenschaften adaptiert. So werden quasi-stationäre Geräuschquellen, wie beispielsweise Fahrgeräusche bei konstanter Geschwindigkeit, und nicht-stationäre Geräusche, wie das Rattern eines vorbeifahrenden Zuges unterschiedlich stark bewertet, um eine möglichst genaue Approximation an die subjektiv empfundene Qualität zu erreichen. HASQUE bildet mit der Cochleatransformation die Höreigenschaften des menschlichen Ohres nach, vergleicht über diese Nachbildung Ein– und Ausgangssignal eines Systems und berechnet aus den „hörbaren“ Fehlern ein Qualitätsmaß. 

Die Skalierung des Qualitätsmaßes kann individuell festgelegt werden. Eine Skalierung nach Empfehlungen der ITU-T [6,7,8] auf einer 5 Punkteskala (bspw. der STI-CIS-Skala) ist ebenso möglich wie eine prozentuale Skalierung. Ein wesentliches Merkmal des HASQUE Verfahrens ist, dass die Hörtestparameter Wiedergabelautstärke, Bandbreite und Akzeptanzschwelle individuell festgelegt werden können, womit eine natürliche Anpassung an verschiedene Hörtestbedingungen möglich ist. HASQUE Messsysteme stehen sowohl für die Beurteilung von Endgeräten in Echtzeit, als auch zur Beurteilung von PCM-Aufnahmen als Offlinesystem zur Verfügung.

Messungen an Endgeräten in Echtzeit[Bearbeiten]

Bild 1: HASQUE Hörtestsimulator für Echtzeitmessungen
Datei:HASQUE-Bild2.png
Bild 2: Programmierbespiele

Echtzeitmesssysteme arbeiten bidirektional mit analogen Schnittstellen, welche  mit hochwertigen 24-Bit-Wandlern bei 48 kHz abgetastet werden. Dem Anwender steht ein Hardwaretestprogramm zur Verfügung, welches über eine automatische Parametrierung eine korrekte Aussteuerung der Signalschnittstellen gewährleistet, um bestmögliche und reproduzierbare Qualitätsmaße zu erhalten.

Echtzeitmessungen werden mit Hilfe eines programmierbaren Taskinterpreters gestartet. Während der Messung werden Aufnahmen vom zu untersuchenden Terminal aufgezeichnet. Der Taskinterpreter wird zur Steuerung des Messsystems, der Messrichtung, der angeschlossenen Terminals und für die individuelle Auswahl von Testsignalen eingesetzt. Für die Programmierung des Taskinterpreters werden drei Versionen angeboten:

Bild 2 zeigt Programmierbeispiele für verschiedene Taskinterpreter, bei denen immer der gleiche Messablauf durchgeführt wird. Die TIP-Programmierung ermöglicht die individuelle Festlegung der Reaktionszeit der Hardware bei der Umschaltung der Messrichtung über die Push-to-Talk-Tastenfunktion (PTT). Die TOP-Programmierung fasst die PTT Steuerung in einem Befehl zusammen, wobei die Reaktionszeit der Hardware als fester Wert in den Settings der Software eingegeben werden kann. Die TUP-Programmierung ist für verteilte Messsysteme mit unidirektionaler Steuerung vorgesehen, bietet die gleiche Programmierung der Reaktionszeit der Hardware wie TOP und arbeitet mit einer definierten Datenbasis, aus der die Testdaten durch Synonyme (Ref1...Ref2) ausgewählt werden können.

Offlinemessungen mit PCM - Aufnahmen[Bearbeiten]

Offlinemessungen werden mit windowskonformen PCM-Signalen (*.wav Dateien) durchgeführt. Es können sowohl einzelne Messungen als auch Serienmessungen durchgeführt werden.  Die Abtastrate des Messsystems wird automatisch an die im Header der Audiodatei angegebene Abtastrate angepasst. Bei Serienmessungen werden zusätzlich Statistiken über die Qualitätsmaße, die Latenz und die Sprachunterbrechungen erzeugt. Für die Zusammenstellung von Serienmessungen steht dem Anwender ein spezieller Editor zur Verfügung.

Messergebnisse und Darstellungen[Bearbeiten]

HASQUE-Messsysteme sind mit statistischer Auswertung von Messreihen ausgerüstet. Mit der Anzeige der Verteilungsfunktion der MOS-Werte, Signallaufzeiten und Sprachunterbrechungen lassen sich mühelos Rückschlüsse auf die Eigenschaften der zu untersuchenden Systeme schließen. Mit Hilfe der Darstellung von Einzelergebnissen mit der grafischen Anzeige der hörbaren Störungen lassen sich detaillierte Untersuchungen an einzelnen Testfällen durchführen. Ausgewählten Passagen können mit Hilfe der Abspielfunktion abgehört und verglichen werden. Die Darstellung von Spektren erfolgt mit gehöradäquater Frequenzverteilung und zeigt die Frequenzgruppen auf der Bark-Skala. Dadurch sieht man, was man hört.

Vergleich mit subjektiven Hörtests[Bearbeiten]

Vergleicht man die Ergebnisse verschiedener Hörtests, ergeben sich erwartungsgemäß mit zunehmenden Störungen geringere Qualitätsmaße (MOS). Störungen können hierbei Geräusche, Signalunterbrechungen, lineare und nichtlineare Verzerrungen sein, weswegen die Abszisse in Bild 6 ohne Einheit angegeben ist.

Die maximalen Abweichungen der subjektiven Qualitätsbeurteilung (grün gestrichelt) vom gemittelten MOS-Wert (grün) ergeben sich durch die individuelle Akzeptanzschwelle der Testpersonen und können auch in Abhängigkeit von der Tagesform einer Testperson schwanken. Interessant ist hierbei die Tatsache, dass die Qualitätsunterscheidung - was klingt besser, was schlechter - zwischen den einzelnen Testfällen bei allen Testpersonen stark korrelieren und die Akzeptanzschwelle somit als Offset aufgefasst werden kann.

Die blaue Kurve im Bild 6 zeigt die objektiven Qualitätsmaße mit HASQUE und die graue Kurve die Ergebnisse mit anderen Messverfahren.

Wesentliche Fehler bei der objektiven Qualitätsbeurteilung können durch eine fehlerhafte Nachbildung der Höreigenschaften auftreten. Im Folgenden hierzu Hörproben mit unterschiedlicher Qualität.

Verfahren Eingangssignal 8kHz Ausgangssignal 8kHz Eingangssignal 16kHz Ausgangssignal 16kHz
HASQUE 4.5 3.1 4.5 2.7
Andere mit IRS 4.5 4.4 4.5 4.3

Aufnahmen werden mit Hörtestsimulatoren die mit Bandbreitenbegrenzung arbeiten trotz deutlich hörbarer Qualitätsunterschiede fast gleich gut bewertet. Die Bandbreitenbegrenzung ist nicht für die Qualitätsbeurteilung von allen Systemen geeignet.

Literatur[Bearbeiten]

  • E. Terhardt: Fourier Transformation of Time Signals. Acustica, Vol. 57, 1985.
  • Rolf Kapust: Qualitätsbeurteilung codierter Audiosignale mittels einer BARK – Transformation. Dissertation, Technische Fakultät der Universität Erlangen, 1993.
  • Michael Walker: Gehöradäquate digitale Sprachsignalverarbeitung. Funkschau 04/2003.
  • E. Zwicker: Psychoakustik. Springerverlag, 1982, ISBN 3-540-11401-7.
  • E. Zwicker, H. Fastl: Psychoacoustics. Springerverlag, 1999, ISBN 3-540-65063-6.
  • ITU-T P300 Recommendation Methods for subjective determination of transmission quality (englisch)
  • ITU-T P835 Recommendation Subjective test methodology for evaluating speech communication systems that include noise suppression algorithm (englisch)
  • ITU-T Recommendation P862 Perceptual evaluation of speech quality (PESQ), an objective method for end-to-end speech quality assessment of narrow band telephone networks and speech codecs, 02/2001, (englisch)

Einzelnachweise[Bearbeiten]





Diese artikel "HASQUE" ist von Wikipedia The list of its authors can be seen in its historical.



Read or create/edit this page in another language[Bearbeiten]