Psychoakustische Qualitätsbeurteilung von Audiocodierverfahren

Größe: px
Ab Seite anzeigen:

Download "Psychoakustische Qualitätsbeurteilung von Audiocodierverfahren"

Transkript

1 Psychoakustische Qualitätsbeurteilung von Audiocodierverfahren DIPL.-ING. FLORIAN KEILER Audiocodierung im MP3-Format ist mit der starken Verbreitung der mobilen Abspielgeräte (MP3- Player) für jeden, der gern Musik hört, ein interessantes Thema. MP3 ist die Kurzform für MPEG-1 Layer-3 (MPEG = Moving Pictures Expert Group) und bezeichnet einen Audiocodierungsstandard. Obwohl es schon verbesserte Codierungsalgorithmen gibt, ist MP3 doch das am stärksten verbreitete Format für komprimierte Musikdaten. Doch warum funktioniert die Codierung mit dem MP3-Verfahren so gut? Warum können so viele Daten weggelassen werden, ohne dass sich ein akustischer Unterschied feststellen lässt? Diese Fragen werden in diesem Artikel genauer analysiert. Insbesondere stellen wir eine Messtechnik zur Qualitätsbeurteilung von Audiocodierverfahren vor, mit der die Eigenschaften des menschlichen Ohrs nachgebildet werden. Diese Messtechnik visualisiert in Echtzeit die Analyse des durch die Audiocodierung entstandenen Codierungsfehlers. UNIV.-PROF. DR.-ING. UDO ZÖLZER PROFESSUR FÜR ALLGEMEI- NE NACHRICHTENTECHNIK Bild 1: Schalldruckpegel (in db) der Ruhehörschwelle über einer logarithmisch skalierten Frequenzachse. Eigenschaften des menschlichen Ohrs Zur Beschreibung der Eigenschaften der Wahrnehmung von Audiosignalen ist eine Darstellung des Signals in Frequenzkomponenten sinnvoll. Ein Musikoder Audiosignal enthält Töne verschiedener Frequenzen und verschiedener Intensität. Töne unterschiedlicher Frequenz nimmt der Mensch unterschiedlich laut wahr. Außerdem kann ein lauter Ton einen anderen leiseren Ton verdecken, so dass dieser nicht mehr wahrgenommen werden kann. Dieser Effekt ist aus Alltagssituationen bekannt, z. B. wenn man bei starken Umgebungsgeräuschen ein Gespräch führen möchte, muss man lauter sprechen, damit man vom Gesprächspartner verstanden wird. Diese Eigenschaften werden bei der Audiocodierung z. B. im MP3-Format ausgenutzt. Die frequenzabhängigen Wahrnehmungseigenschaften verdeutlicht die in Bild 1 angegebene Ruhehörschwelle. Sie gibt abhängig von der Frequenz den Schalldruckpegel eines Sinustons an, der gerade noch wahrgenommen wird. Die Ruhehörschwelle ist für jede Person unterschiedlich und sinkt insbesondere bei hohen Frequenzen mit steigendem Alter der Versuchsperson. Man erkennt deutlich, dass das menschliche Ohr im Frequenzbereich von 2 bis 5 khz am empfindlichsten ist, d. h. dort sind auch Sinustöne mit geringen Pegeln wahrnehmbar. Töne mit sehr tiefen oder sehr hohen Frequenzen müssen hingegen große Pegel aufweisen, damit sie vom menschlichen Ohr wahrgenommen werden. Betrachtet man zwei Töne mit den Frequenzen f 1 und f 2, so kann der Unterschied dieser Frequenzwerte als Quotient oder als Differenz dargestellt werden: Das Gehör nimmt Frequenzunterschiede durch den Quotienten α wahr. So ergibt sich für zwei Töne, die sich um eine Oktave unterscheiden, ein Quotient von α = 2. Daraus folgt, dass bei niedrigen Frequenzen kleinere Frequenzdifferenzen unterschieden werden können als bei großen. So liegt zwischen zwei Tönen mit 50 Hz und 100 Hz eine Oktave, aber ebenso zwischen Hz und Hz, die Frequenzdifferenzen sind aber f = 50 Hz bzw. f = Hz. Das Auflösungsvermögen von Frequenzdifferenzen bezeichnet man auch als Frequenzauflösung. Aus den genannten Gründen werden die in einem Signal enthaltenen Frequenzkomponenten häufig über einer logarithmischen Frequenzachse dargestellt (vgl. Bild 1); über dieser Achse bedeuten gleiche Abstände auch gleiche Quotienten zwischen den betrachteten Frequenzwerten. 8 UNIFORSCHUNG AUSGABE 2005

2 Zwicker hat in [1] festgestellt, dass Schallereignisse vom Menschen in so genannten Frequenzgruppen oder kritischen Bändern wahrgenommen werden. Das menschliche Gehör fasst die Signalleistungen aller Schallereignisse in einer Frequenzgruppe für die Bestimmung der subjektiven Lautstärke zusammen. Der Frequenzbereich von 20 Hz bis 20 khz wird damit in 25 kritische Bänder unterteilt. Zwicker hat für eine Bezeichnung der Frequenzgruppen die Tonheit z mit der Einheit Bark definiert. Jede Frequenzgruppe hat nach dieser Definition die Bandbreite von 1 Bark. Die Frequenzgruppen werden deshalb auch als Bark-Bänder bezeichnet. Die Grenzen dieser Bänder sind in Bild 2 grafisch dargestellt, wobei die Frequenzachse linear (oben) und logarithmisch (unten) skaliert ist. Bild 2: Bandgrenzen der Frequenzgruppen nach Zwicker über linearer und logarithmischer Frequenzachse. Man erkennt an dieser Darstellung, dass bei der logarithmischen Frequenzskalierung die Breiten der Frequenzgruppen als nahezu gleich breit abgebildet werden. Qualitätsbeurteilung von Audiocodecs Jede verlustbehaftete Audiocodierung produziert einen Codierungsfehler. Hiermit wird die Differenz zwischen dem decodierten Signal y(n) und dem Referenzsignal (dem zu codierenden Signal) x(n) bezeichnet. Der ganzzahlige Zeitindex n dieser Signale gibt den aktuell betrachteten Abtastwert an. Bei dieser Differenzbildung ist zu beachten, dass ggf. die Verzögerung (Latenz) durch die Encodierung/Decodierung berücksichtigt werden muss, d.h. das Referenzsignal muss bei der Differenzbildung entsprechend verzögert werden, siehe Bild 3. Bei einer digitalen Codierung ist diese Verzögerung immer eine ganzzahlige Anzahl von Abtastwerten. Das Ziel einer Audiocodierung ist immer, dass der durch die Codierung entstandene Codierungsfehler möglichst nicht wahrnehmbar ist. Bei der Qualitätsbeurteilung eines Audiocodecs ist also zu bewerten, ob das Fehlersignal e(n) zusätzlich zum Originalsignal x(n) wahrnehmbar ist. Ähnlich der Ruhehörschwelle kann für jedes Signal eine so genannte Mithörschwelle oder Maskierungsschwelle angegeben werden [1, 2]. Die Maskierungsschwelle gibt für jede Frequenz an, welchen Pegel ein zusätzliches Signal haben muss, damit es wahrgenommen werden kann. Ist also der Pegel des Fehlersignals für jede Frequenz kleiner als die Maskierungsschwelle, so ist dieses Fehlersignal nicht wahrnehmbar. Da sich das Signal über der Zeit ändert, ändert sich auch seine Maskierungsschwelle, so dass es vom Signal abhängt, welche zusätzlichen Signale überdeckt (maskiert) werden. Die Maskierungsschwelle ist immer mindestens so groß wie die Ruhehörschwelle. Um nun eine Qualitätsbeurteilung durchführen zu können, wird für kleine Zeitausschnitte (Blöcke) des betrachteten Signals die Maskierungsschwelle bestimmt. Nach Ermittlung des Fehlersignals wird dieses ebenfalls im Frequenzbereich analysiert und mit der Maskierungsschwelle verglichen. Dieser Vorgang wird für jeden Block des Signals durchgeführt, um die zeitliche Änderung der Maskierungsschwelle und des Fehlersignals zu berücksichtigen. Um die erläuterte Bewertung durchzuführen, wird ein Modell zur Nachbildung der Maskierungsschwelle benutzt, das von Johnston in [3] vorgestellt wurde. Nach den Betrachtungen der Eigenschaften des menschlichen Ohres zu Beginn dieses Artikels scheint es sinnvoll zu sein, die Maskierungsschwelle sowie den Pegel des Fehlersignals für Frequenzbereiche entsprechend den vorgestellten Frequenzgruppen zu bestimmen. Die Berechnung der Maskierungsschwelle basiert auf der Frequenzanalyse mittels Fouriertransformation (FFT, Fast Fourier Transform) des Signalblocks. Die Berechnung der Mithörschwelle erfolgt in folgenden Schritten (vgl. auch [4, 2]): Frequenzanalyse (FFT) des Signalblocks. Ermittlung der in jeder Frequenzgruppe i erfassten Signalleistung (Pegel L x (i) in db). Berücksichtigung der bandübergreifenden Maskierung, da ein Schallereignis auch benachbarte Frequenzgruppen maskiert [5]. Ermittlung der Tonalität des Signals und Berücksichtigung dieses Maßes, da tonale bzw. rauschartige Signale unterschiedliche Maskierungseffekte verursachen. Anschließende Normierung der erhaltenen Maskierungsschwelle. Vergleich mit der Ruhehörschwelle, da die Maskierungsschwelle immer mindestens den Wert der Ruhehörschwelle haben muss. Bild 3: Ermittlung des Codierungsfehlers bei einer Audiocodierung. UNIFORSCHUNG AUSGABE

3 Für den betrachteten Signalblock wird mit N mask die Anzahl der Frequenzgruppen mit NMR(i) > 0 db bezeichnet. In diesen Bändern ist theoretisch das Fehlersignal wahrnehmbar. Dieser Messwert ist angelehnt an das von Brandenburg [6] eingeführte masking flag, das angibt, ob in mindestens einer Frequenzgruppe die Fehlerleistung über der Maskierungsschwelle liegt. Die Messgröße N mask gibt noch keine Auskunft darüber, wie groß die wahrnehmbare Störung ist. Zur Bewertung der Größe der Störung wird für die Frequenzgruppen, in denen eine Störung wahrnehmbar ist, der Mittelwert des NMR gebildet: Bild 4: Mithörschwelle für ein Sinussignal der Frequenz f = 440 Hz. Zur Ermittlung der Leistung des Fehlersignals für jede Frequenzgruppe werden die durch die Frequenzanalyse ermittelten Signalleistungen für jedes Band aufsummiert. Als Ergebnis dieser Analysen erhält man für jede Frequenzgruppe i: Die Signalleistung L x (i) in db. Die Maskierungsschwelle L m (i) in db. Die Fehlerleistung L e (i) in db. Bild 4 zeigt als Beispiel die Maskierungsschwelle (dunkelgrau) für ein Sinussignal. Zusätzlich ist die per FFT ermittelte Signalleistung (schwarz) sowie die Ruhehörschwelle (hellgrau) dargestellt. Im Unterschied zu Bild 1 wurden die Pegel auf die Maximalaussteuerung von 0 db normiert An diesem Beispiel ist deutlich zu erkennen, dass das Sinussignal auch benachbarte Frequenzbereiche maskiert. So wäre beispielsweise ein weiterer Sinuston der Frequenz 500 Hz mit einem Pegel von -40 db nicht wahrnehmbar. Messwerte Ausgehend von der oben beschriebenen Analyse des Original- und Fehlersignals kann für jede Frequenzgruppe der Rausch-zu-Maskierungs-Abstand (NMR, noise-to-mask ratio) in db angegeben werden: Als Beispiel betrachten wir die Codierung eines hohen Violintons im MP3-Format mit einer Bitrate von 128 kbit/s. Alle in diesem Artikel angegeben Bitraten beziehen sich auf ein Stereosignal; ausgehend von CD-Qualität (16 Bit bei 44,1 khz Abtastrate) mit ca. 1,4 Mbit/s ergibt sich also eine Kompression um etwa den Faktor 11. In Bild 5 sind die Signalleistungen abhängig von der Frequenz für das Originalsignal, das decodierte Signal und den Codierungsfehler über einer linearen Frequenzachse dargestellt. Bei der genutzten Codierung gehen die Komponenten ab etwa 17 khz verloren, ebenso sind im Bereich von etwa 8 bis 16 khz deutliche Unterschiede zwischen Original und decodiertem Signal erkennbar. An der Frequenzbereichsanalyse des Fehlersignals erkennt man eine Ähnlichkeit zum Originalsignal, weshalb dieser Fehler nur schwer wahrzunehmen ist. Bild 6 zeigt die Ergebnisse der psychoakustischen Bewertung dieses Signals. Hier wird für 9 Frequenzgruppen eine Überschreitung der Mithörschelle detektiert, und die durchschnittliche Überschreitung liegt bei etwa 2,3 db. Bild 5: Frequenzspektren von Original, decodiertem Signal und Codierungsfehler für ein Violin-Signal bei MP3-Codierung mit 128 kbit/s. Ergebnisse Für einen Vergleich der MP3-Codierung eines Musikstücks bei verschiedenen Bitraten soll eine Bewertung mit den oben eingeführten Messgrößen erfolgen. Zusätzlich wird noch der Signal-Rausch-Abstand (SNR, signal-to-noise ratio) angegeben. Dieses 10 UNIFORSCHUNG AUSGABE 2005

4 Bild 6: Psychoakustische Bewertung für ein Violin-Signal bei MP3-Codierung mit 128 kbit/s. Maß ist die Differenz der Pegel in db von Originalsignal und Fehlersignal. Wie bei der psychoakustischen Analyse wird diese Berechnung für kleine Blöcke durchgeführt und anschließend der Mittelwert über alle Blöcke ermittelt. Für diese Art der Berechnung spricht man auch vom segmentellen SNR oder kurz segsnr. Das SNR berücksichtigt nicht die Frequenzkomponenten bzw. die Wahrnehmbarkeit, ist also nur bedingt zur Qualitätsbeurteilung nutzbar. Das SNR nimmt bei kleinen Rauschleistungen große Werte an. Nimmt das SNR also sehr große Werte an, ist die Qualität auch gut. Bei kleinen Werten des SNR muss die Qualität jedoch nicht schlecht sein, weil der Fehler evtl. nicht wahrgenommen wird. Als Testsignal wurde der Titel Iron Hand der Gruppe Dire Straits gewählt und dieses Signal wurde mit dem LAME MP3-Coder (Version ) in verschiedenen Bitraten codiert. Es wurden sowohl konstante als auch Durchschnittsbitraten gewählt. Bei letzterer Einstellung wird die vorgegebene Bitrate im Durchschnitt erreicht, wobei für jeden Signalblock die Anzahl zur Verfügung stehender Bits optimiert wird. Die ermittelten Messwerte sind in Tabelle 1 und Bild 7 dargestellt. Bei allen drei betrachteten Messwerten ist eine Qualitätsverbesserung mit steigender Bitrate zu erkennen. Allerdings zeigt sich für das benutzte Musikstück bei Nutzung einer durchschnittlichen Tabelle 1: Vergleich der Codierungsqualität der MP3-Codierung bei verschiedenen Bitraten. Die Bezeichnung (a) kennzeichnet die Nutzung einer durchschnittlichen Bitrate. Bitrate N mask NMR m segsnr in kbit/s in db in db 96 15,44 5,57 20,09 96(a) 15,11 5,44 20, ,77 4,24 22,50 128(a) 12,81 4,27 22, ,65 1,71 28,58 192(a) 7,30 1,61 28, ,08 0,20 45,36 Bild 7: Vergleich der Codierungsqualität der MP3-Codierung bei verschiedenen Bitraten. Die Bezeichnung (a) kennzeichnet die Nutzung einer durchschnittlichen Bitrate. Bitrate gegenüber der konstanten Bitrate kein wesentlicher Qualitätsunterschied. Bei der Bitrate von 128 kbit/s ist die Qualität bei konstanter Bitrate sogar minimal besser als bei Nutzung der durchschnittlichen Bitrate. Echtzeitrealisierung Im Rahmen einer Diplomarbeit [4] sowie zweier Studienarbeiten [7, 8] entstand an der Professur für Allgemeine Nachrichtentechnik eine Programmumgebung für MS Windows, mit der die beschriebene psychoakustische Qualitätsbeurteilung in Echtzeit visualisiert werden kann. Die auf den genannten Arbeiten basierende Programmoberfläche ist in Bild 8 abgebildet. Die Anwendung ist in C++ implementiert und erlaubt den Zugriff auf Sound-Dateien im *.wav Format sowie auf den Soundkarten-Eingang. Unten links kann das über die Soundkarte abzuspielende Signal ausgewählt werden. Nach Auswahl einer Audiodatei mit Originalsignal und Codierungsfehler und Starten der Analyse werden im mittleren Zeichenbereich die zeitlich schwankenden Werte von L x (i), L m (i) und L e (i) über der Frequenz grafisch dargestellt (vgl. auch Bild 6 oben). Auf der rechten Seite werden die Histogramme (Häufigkeitsverteilungen) für die psychoakustischen Messwerte dargestellt. Oben erkennt man für jeden Wert von N mask (Anzahl der Frequenzgruppen mit Überschreitung der Maskierungsschwelle) die Häufigkeit des Auftretens dieses Wertes. Unten ist entsprechend die Verteilung für den Messwert NMR m (dort mit M mask bezeichnet) angegeben, wobei jeweils ein Bereich von 1 db Breite betrachtet wird. Im unteren Bereich der Programmoberfläche sind an den sich horizontal bewegenden Balken die aktuel- UNIFORSCHUNG AUSGABE

5 Bild 8: Programmoberfläche zur Psychoakustischen Qualitätsbeurteilung. len Messwerte abzulesen, wobei auch das segsnr angegeben ist, zusätzlich wird jeweils der aktuelle Mittelwert als Zahlenwert angegeben. Zusammenfassung In diesem Artikel wurden nach einer kurzen Darstellung der Eigenschaften des menschlichen Ohrs psychoakustische Messgrößen zur Qualitätsbeurteilung von Audiocodierverfahren wie z. B. MP3 vorgestellt. Basierend auf der signalabhängigen Modellierung der Mithörschwelle kann bewertet werden, in welchem Maße ein aufgetretener Codierungsfehler wahrnehmbar ist. Viele Audio-Codierverfahren wie MP3 benutzen beim Codiervorgang eine ähnliche Berechnung der Maskierungsschwelle, um eine effiziente Datenreduktion zu erzielen. Die vorgestellte Echtzeit-Messtechnik ist sehr hilfreich zur Qualitätsbeurteilung von codierten Audiosignalen, bei denen die enthaltenen Fehler nicht sofort hörbar sind bzw. intensive Hörtests erfordern würden. So ist die Qualitätsbeurteilung insbesondere während der Entwicklung eines Audiocodierverfahrens wichtig, um ggf. den eingesetzten Algorithmus zu optimieren. Literatur [1] EBERHARD ZWICKER, Psychoakustik, Springer-Verlag, Berlin, [2] UDO ZÖLZER, Digitale Audiosignalverarbeitung, B.G. Teubner, Stuttgart, 3., überarbeitete und erweiterte Auflage, [3] JAMES D. JOHNSTON, Transform coding of audio signals using perceptual noise criteria, IEEE Journal on Selected Areas in Communications, Vol. 6, No. 2, pp , Febr [4] MARC FRITZ, Entwicklung und Implementierung eines Verfahrens zur psychoakustischen Qualitätsbeurteilung von Audiokodierverfahren, Diplomarbeit, Universität der Bundeswehr Hamburg, Juli [5] M. R. SCHROEDER, B. S. ATAL UND J. L. HALL, Optimizing digital speech coders by exploiting masking properties of the human ear, The Journal of the Acoustical Society of America, Vol. 66, No. 6, pp , [6] KARLHEINZ BRANDENBURG, Ein Beitrag zu den Verfahren und der Qualitätsbeurteilung für hochwertige Musikcodierung, Dissertation, Technische Fakultät der Universität Erlangen-Nürnberg, [7] VINCENT REUTER, Implementierung eines Directshow-Plugins zur psychoakustischen Qualitätsbeurteilung von Audiokodierverfahren, Studienarbeit, Technische Universität Hamburg-Harburg/Universität der Bundeswehr Hamburg, Nov [8] SAYAK GHOSH CHOUDHURY, Audio Quality Measurement with a Psychoacoustic Model, Project Work, Technische Universität Hamburg-Harburg/Helmut-Schmidt-Universität Universität der Bundeswehr Hamburg, Dez UNIFORSCHUNG AUSGABE 2005

Ausnutzung von Wahrnehmungseigenschaften in der Audiocodierung

Ausnutzung von Wahrnehmungseigenschaften in der Audiocodierung Vorlesung Quellencodierung Ausnutzung von Wahrnehmungseigenschaften in der Audiocodierung Hintergrund Datenreduktion durch Redundanzreduktion Ausnutzung von Signaleigenschaften Irrelevanzreduktion Ausnutzung

Mehr

Puls-Code-Modulation. Thema: PCM. Ziele

Puls-Code-Modulation. Thema: PCM. Ziele Puls-Code-Modulation Ziele Mit diesen rechnerischen und experimentellen Übungen wird die Vorgehensweise zur Abtastung und linearen Quantisierung eines analogen Signals erarbeitet. Bei der Abtastung werden

Mehr

Digitale Audiokodierung mit MP3, Varianten und Anwendungsgebiete

Digitale Audiokodierung mit MP3, Varianten und Anwendungsgebiete Fakultät Informatik, Institut für Technische Informatik, Professur für VLSI-Entwurfssysteme, Diagnostik und Architektur Digitale Audiokodierung mit MP3, Varianten und Anwendungsgebiete Dirk Schulze Dresden,

Mehr

Psychoakustische Phänomene. Proseminar Musikalische Datenbanken Matthias Voh

Psychoakustische Phänomene. Proseminar Musikalische Datenbanken Matthias Voh Psychoakustische Phänomene Proseminar Musikalische Datenbanken Matthias Voh 08.12.2003 Gliederung 1. Psychoakustik 2. Psychoakustische Phänomene 1. Ruhehörschwelle und Hörfläche 2. Wahrnehmung der Tonhöhe

Mehr

Frequenzbewertung von Luftschallsignalen

Frequenzbewertung von Luftschallsignalen 04/17 von Luftschallsignalen Das menschliche Ohr empfindet Töne mit gleichem Schalldruck aber unterschiedlichen Tonhöhen unterschiedlich laut. Dieser frequenzabhängige Empfindlichkeitsverlauf des menschlichen

Mehr

Multimediale Werkzeuge, Audio: Formate, Tools. -Sound/Audio Objekte. Formate, Beispiele:

Multimediale Werkzeuge, Audio: Formate, Tools. -Sound/Audio Objekte. Formate, Beispiele: Multimediale Werkzeuge, Audio: Formate, Tools -Sound/Audio Objekte Formate, Beispiele: - Mp3 (Kurz für MPEG1/2 Layer 3) - PCM (z.b. Wave Datei), übliche Formate: CD: 44100 HZ Abtastrate, 16 Bits/Abtastwert.

Mehr

1.3 Digitale Audiosignale

1.3 Digitale Audiosignale Seite 22 von 86 Abb. 1.2.12 - Wirkung der Schallverzögerung Effekte sind: Delay, Echo, Reverb, Flanger und Chorus Hört man ein akustisches Signal im Raum, dann werden die Signale von Wänden und anderen

Mehr

Statistische Kenngrößen. Histogramm. Grundlagen zur statistischen Signalverarbeitung. Statistische Beschreibung von Audio

Statistische Kenngrößen. Histogramm. Grundlagen zur statistischen Signalverarbeitung. Statistische Beschreibung von Audio 8.3.6 Statistische Kenngrößen Grundlagen zur statistischen Signalverarbeitung Dr. Detlev Marpe Fraunhofer Institut für achrichtentechnik HHI Histogramm Wahrscheinlichkeitsdichteverteilung Mittelwert µ

Mehr

MPEG Audio Layer 1. Fachbereich Medieninformatik. Hochschule Harz. Referat. Kolja Schoon. Thema: MPEG Audio Layer 1

MPEG Audio Layer 1. Fachbereich Medieninformatik. Hochschule Harz. Referat. Kolja Schoon. Thema: MPEG Audio Layer 1 Fachbereich Medieninformatik Hochschule Harz MPEG Audio Layer 1 Referat Kolja Schoon 10952 Abgabe: 15.01.2007 Stand: (Januar 2007) Autor: Kolja Schoon Seite 1 Inhaltsverzeichnis 1. Einleitung / Vorwort...3

Mehr

Multimediale Werkzeuge 1, Audio-Berabeitung. normierte Frequenz (normiert auf die halbe Abtastrate, maximale Frequenz ist pi oder 1

Multimediale Werkzeuge 1, Audio-Berabeitung. normierte Frequenz (normiert auf die halbe Abtastrate, maximale Frequenz ist pi oder 1 Multimediale Werkzeuge 1, Audio-Berabeitung normierte Frequenz (normiert auf die halbe Abtastrate, maximale Frequenz ist pi oder 1 Beachte: Teilbänder werden nach den Unter-Abtasten "aufgeblasen" (siehe

Mehr

Ludwig-Maximilians-Universität München Prof. Hußmann Digitale Medien 6-32

Ludwig-Maximilians-Universität München Prof. Hußmann Digitale Medien 6-32 6. Ton und Klang 6.1 Ton: Physikalische und physiologische Aspekte 6.2 Kompression von Audio-Signalen: MPEG-Audio 6.3 Audio-Datenformate: Übersicht 6.4 Klangerzeugung und MIDI Ludwig-Maximilians-Universität

Mehr

Audio Kompression: MPEG. Audio Kompression: MPEG. Audio Kompression: MPEG. Medien Technik. Medien Technik. Erlangen. Medien Technik.

Audio Kompression: MPEG. Audio Kompression: MPEG. Audio Kompression: MPEG. Medien Technik. Medien Technik. Erlangen. Medien Technik. Audio Kompression: MPEG Karlheinz Brandenburg Audio Kompression: MPEG MPEG 2: (1994) Erlangen Ziel: Digitales Fernsehen, viele Bitraten z.b. DVD, Videokonferenzen Bernhard Grill Moving Pictures Experts

Mehr

Sinneswahrnehmungen des Menschen

Sinneswahrnehmungen des Menschen Sinneswahrnehmungen des Menschen Tastsinn Gleichgewicht Geruch Sehen Gehör Sprache Aktion Multimedia - Kanäle des Menschen Techniken für Medien im Wandel Multimediale Kommunikation Text : Bücher, Zeitschriften

Mehr

Aufgabe 1 (20 Punkte)

Aufgabe 1 (20 Punkte) Augabe 1 (20 Punkte) Es wird ein Sprachsignal x(t) betrachtet, das über eine ISDN-Teleonleitung übertragen wird. Das Betragsspektrum X() des analogen Signals kann dem nachstehenden Diagramm entnommen werden.

Mehr

Technische Beschreibung der akustischen Signalkette

Technische Beschreibung der akustischen Signalkette Technische Beschreibung der akustischen Signalkette Wichtige Aufgabe: Vielfältige Medien Gestaltung akustischer Kommunikationsketten (Sprache, Geräusche, Musik, CD, Radio, mp3,...) Unterschiedlichste Information

Mehr

7. Akustische Grundlagen

7. Akustische Grundlagen -Übersicht 36. Einleitung. Strömungsmechanische Grundlagen 3. Aerodynamisches Fahrzeugdesign 4. Motorkühlung 5. üftung und Klimatisierung 6. Abgasturbolader Definition und Ausbreitung des Schalls Schalldruck-

Mehr

Digitale Audiotechnik Technología de audio digital. Friederike Maier IKX 2012

Digitale Audiotechnik Technología de audio digital. Friederike Maier IKX 2012 Digitale Audiotechnik Technología de audio digital Friederike Maier IKX 2012 Vom Studio ins Netz Sender CD Rechner Mitschnitt HörerInnen Mikro Mikro2 Mischpult/Kompressor Rechner/ Soundkarte Streamingerver

Mehr

Audio-Bearbeitung. Diese Freq. Anteile «verschwinden» nach dem unterabtasten Filter muß schmal genug sein! Nach Unterabtastung

Audio-Bearbeitung. Diese Freq. Anteile «verschwinden» nach dem unterabtasten Filter muß schmal genug sein! Nach Unterabtastung Audio Signal Audio-Bearbeitung Ampl Vor Unterabtastung Teilband Grenzen Normierte Frequenz (normierte Abtastrate, maximale Frequenz ist pi oder 1) Teilbänder Diese Freq. Anteile «verschwinden» nach dem

Mehr

Versuch 5: Filterentwurf

Versuch 5: Filterentwurf Ziele In diesem Versuch lernen Sie den Entwurf digitaler Filter, ausgehend von der Festlegung eines Toleranzschemas für den Verlauf der spektralen Charakteristik des Filters, kennen. Es können Filtercharakteristiken

Mehr

Übung zur Vorlesung. Digitale Medien. Vorlesung: Heinrich Hußmann Übung: Renate Häuslschmid, Hanna Schneider

Übung zur Vorlesung. Digitale Medien. Vorlesung: Heinrich Hußmann Übung: Renate Häuslschmid, Hanna Schneider Übung zur Vorlesung Digitale Medien Vorlesung: Heinrich Hußmann Übung: Renate Häuslschmid, Hanna Schneider Wintersemester 2015/16 Frequenzraum 0 5 10 15 20 Zeit (ms) f = 1/T T = 10ms = 0,01s f = 1/ 0,01s

Mehr

Audio- und Videodatenströme im Internet

Audio- und Videodatenströme im Internet Audio- und Videodatenströme im Internet Jürgen Quittek Institut für Informatik Freie Universität Berlin C&C Research Laboratories NEC Europe Ltd., Berlin Vorlesung Rechnernetze Institut für Informatik

Mehr

2. Digitale Codierung und Übertragung

2. Digitale Codierung und Übertragung 2. Digitale Codierung und Übertragung 2.1 Informationstheoretische Grundlagen 2.2 Speicherbedarf und Kompression 2.3 Digitalisierung Ludwig-Maximilians-Universität München Prof. Hußmann Digitale Medien

Mehr

Proseminar Datenkompression

Proseminar Datenkompression Proseminar Datenkompression Soundkompression Michael Grünert Markus Rickert Übersicht Fähigkeiten von MPEG Digitalisierung / Sampling Das Psychoakustische Modell Hörschwelle Simultane Maskierung Zeitliche

Mehr

und mit t in Sekunden wird mit einer Frequenz von 8000 Hz abgetastet. Die Abtastung beginnt bei t=0 mit dem Zeitindex n=0.

und mit t in Sekunden wird mit einer Frequenz von 8000 Hz abgetastet. Die Abtastung beginnt bei t=0 mit dem Zeitindex n=0. Aufgabe 1 Das periodische Signal x t) 0,5 sin(2 f t) 0,5 cos(2 f t) mit f 1000Hz und mit f 2000Hz ( 1 2 1 2 und mit t in Sekunden wird mit einer Frequenz von 8000 Hz abgetastet. Die Abtastung beginnt bei

Mehr

2. Digitale Codierung und Übertragung

2. Digitale Codierung und Übertragung 2. Digitale Codierung und Übertragung 2.1 Informationstheoretische Grundlagen 2.2 Speicherbedarf und Kompression 2.3 Digitalisierung Ludwig-Maximilians-Universität München Prof. Hußmann Digitale Medien

Mehr

Neue Technologien in Internet und WWW. 0. Einleitung. 1. Digitalisierung 1.1 Sampling und Quantisierung (1) 1. Digitalisierung

Neue Technologien in Internet und WWW. 0. Einleitung. 1. Digitalisierung 1.1 Sampling und Quantisierung (1) 1. Digitalisierung Neue Technologien in Internet und WWW 0. Einleitung Kodierung und Komprimierung von Audiodaten Was ist Schall? Schwingungen von Molekülen in einem elastischen Medium, die sich wellenförmig ausbreiten.

Mehr

Pegelrechnung. Version Holger Stolzenburg. SAE-Hamburg

Pegelrechnung. Version Holger Stolzenburg. SAE-Hamburg Version 2.4 Inhaltsverzeichnis 1 Pegel...4 1.1 Absolute Pegel...4 1.1.1 Leistungspegel...4 1.1.2 Schalldruckpegel...4 1.1.3 Spannungspegel (Tonstudiotechnik)...4 1.1.4 Spannungspegel (Hifi-Technik)...4

Mehr

Analyse von Geräuschen, die beim Auftreffen eines Golfschlägers auf den Ball entstehen

Analyse von Geräuschen, die beim Auftreffen eines Golfschlägers auf den Ball entstehen 05/17 Analyse von Geräuschen, die beim Auftreffen eines Golfschlägers auf den Ball entstehen Das Auftreffen des Golfschlägers auf einen Golfball erzeugt Geräusche, die, sofern der Ball richtig getroffen

Mehr

9. Vorlesung. Systemtheorie für Informatiker. Dr. Christoph Grimm. Professur Prof. Dr. K. Waldschmidt, Univ. Frankfurt/Main

9. Vorlesung. Systemtheorie für Informatiker. Dr. Christoph Grimm. Professur Prof. Dr. K. Waldschmidt, Univ. Frankfurt/Main 9. Vorlesung Systemtheorie für Informatiker Dr. Christoph Grimm Professur Prof. Dr. K. Waldschmidt, Univ. Frankfurt/Main Letzte Woche: Abtastung und Rekonstruktion Abtastung: Wandelt bandbegrenzte kontinuierliche

Mehr

Grundlagen der Videotechnik, Farbe 2

Grundlagen der Videotechnik, Farbe 2 Grundlagen der Videotechnik, Farbe 2 1 Beispiel für additive Farbmischung: Aus: O. Limann: Fernsetechnik ohne Ballast, Franzis Verlag 2 Veranschaulichung Farbe, Farbkomponenten Aus: O. Limann: Fernsetechnik

Mehr

Verträglichkeit zwischen DRM+ und FM

Verträglichkeit zwischen DRM+ und FM Verträglichkeit zwischen DRM+ und FM Friederike Maier, Albert Waal, Institut für Kommunikationstechnik, Leibniz Universität Hannover 7.November 2008 1 Einleitung Zum testen des nötigen Frequenzabstandes

Mehr

3. Fourieranalyse und Amplitudenspektren

3. Fourieranalyse und Amplitudenspektren 3.1 Fourieranalyse 3.1.1 Einleitung Laut dem französischen Mathematiker Fourier (1768-1830) kann jedes periodische Signal in eine Summe von sinusförmigen Signalen mit unterschiedlichen Amplituden, Frequenzen

Mehr

Audio Codecs. Vortrag im Seminar. Digital Audio. Sebastian Kraatz. 15. Dezember 2004

Audio Codecs. Vortrag im Seminar. Digital Audio. Sebastian Kraatz. 15. Dezember 2004 Vortrag im Seminar Digital Audio 15. Dezember 2004 1 Motivation Unkomprimierte digitale Daten Was ist ein Codec? 2 Hörschwellenmaskierung Frequenzmaskierung Zeitmaskierung 3 Motivation Unkomprimierte digitale

Mehr

MP3 --- MPC --- AAC --- OGG. Inhalt: Einführung Aufbau Technik MP3 und danach. Einführung Qualität Technik Vor- und Nachteile Fazit

MP3 --- MPC --- AAC --- OGG. Inhalt: Einführung Aufbau Technik MP3 und danach. Einführung Qualität Technik Vor- und Nachteile Fazit Inhalt: MP3 Einführung Aufbau Technik MP3 und danach AAC Einführung Qualität Technik Vor- und Nachteile Fazit MPC Einführung Qualität Technik Vor- und Nachteile Fazit OGG Einführung Qualität Technik Vor-

Mehr

Digital Signal Processing Audio Measurements Custom Designed Tools. Praktische MLS Messung mit typischen Fehlerbildern

Digital Signal Processing Audio Measurements Custom Designed Tools. Praktische MLS Messung mit typischen Fehlerbildern Praktische MLS Messung mit typischen Fehlerbildern In diesem praktischen Beispiel möchten wir Ihnen zeigen, wie Sie mit MLS den Frequenzgang einer Soundkarte messen können. MLS ist ein sehr leistungsfähiges

Mehr

Adaptive Differenz-Puls-Code-Modulation (ADPCM) und Lineare, Prädiktive Codierung (LPC)

Adaptive Differenz-Puls-Code-Modulation (ADPCM) und Lineare, Prädiktive Codierung (LPC) Adaptive Dierenz-Puls-Code-Modulation (ADPCM) und Lineare, Prädiktive Codierung (LPC) Ziele Mit diesen rechnerischen und experimentellen Übungen werden die Anwendungen der DPCM mit einer Anpassung der

Mehr

Akustischer Dopplereffekt

Akustischer Dopplereffekt Akustischer Dopplereffekt Eine Projektarbeit im Rahmen der Einführung in die Computerorientierte Physik Karl-Franzens-Universität Graz Akustischer Dopplereffekt p.1/25 Zielsetzung experimentelle Verifizierung

Mehr

Arne Heyda, Marc Briede, Ulrich Schmidt: Datenformate im Medienbereich, Fachbuchverlag Leipzig 2003, Kapitel 5

Arne Heyda, Marc Briede, Ulrich Schmidt: Datenformate im Medienbereich, Fachbuchverlag Leipzig 2003, Kapitel 5 5. Ton und Klang 5.1 Ton: Physikalische und physiologische Aspekte 5.2 Kompression von Audio-Signalen: MPEG-Audio 5.3 Audio-Datenformate: Übersicht 5.4 Klangerzeugung und MIDI Weiterführende Literatur:

Mehr

Informatik / G. Graubner

Informatik / G. Graubner Was ist Schall Schwingung Eigenschaften von Schallquellen Welle grafische Darstellung Hörfläche Schall/Ton/Klang/Geräusch Digitaler Ton Qualitätskriterien Wiedergabe und Aufnahme Speicherung digitaler

Mehr

Dr-Jordan-Design professional digital signal processing. Meßbeispiele: Messung der Nachhallzeit (Reverberation) mit MLS

Dr-Jordan-Design professional digital signal processing. Meßbeispiele: Messung der Nachhallzeit (Reverberation) mit MLS Meßbeispiele: Messung der Nachhallzeit (Reverberation) mit MLS Benötigt werden: WinAudioMLS mit Nachhallzeit Plug-In Signalgenerator (PRO) Meßmikrofon mit Vorverstärker Lautsprecher mit Verstärker Optional

Mehr

Spektrale Analysen in EMU-R: eine Einführung. Jonathan Harrington

Spektrale Analysen in EMU-R: eine Einführung. Jonathan Harrington Spektrale Analysen in EMU-R: eine Einführung Jonathan Harrington 1. Ein digitales Sinusoid 2. Fourier-Analyse 3. Ein Spektrum 4. Frequenz- und Zeitauflösung 5. Berechnung von Spektra mit Emu 1. Ein digitales

Mehr

Multimediatechnik / Video

Multimediatechnik / Video Multimediatechnik / Video Video-Kompression Zusammenfassung http://www.nanocosmos.de/lietz/mtv 2009 1 Motivation: Video-Kompression Unkomprimierte Datenmengen sind zu groß! TV: 20 MB/s = 72 GB/h (720x576x2x25)

Mehr

Biologische Übungen III Donnerstag, Kurs 5 Hören. Susanne Duncker Anja Hartmann Kristin Hofmann

Biologische Übungen III Donnerstag, Kurs 5 Hören. Susanne Duncker Anja Hartmann Kristin Hofmann Arbeitsgruppe D 6 Dees Duncker Hartmann Hofmann Protokoll Einleitung Im heutigen Kurs führten wir drei Versuche zum Hören durch. Der erste beschäftigte sich mit der Bestimmung der Hörschwellenkurve der

Mehr

Beate Meffert, Olaf Hochmuth: Werkzeuge der Signalverarbeitung, Pearson 2004

Beate Meffert, Olaf Hochmuth: Werkzeuge der Signalverarbeitung, Pearson 2004 4 Signalverarbeitung 4.1! Grundbegriffe! 4.2! Frequenzspektren, Fourier-Transformation! 4.3! Abtasttheorem: Eine zweite Sicht Weiterführende Literatur (z.b.):!! Beate Meffert, Olaf Hochmuth: Werkzeuge

Mehr

3. Psychoakustische Wahrnehmung. Schallphysik wie entstehen Töne?

3. Psychoakustische Wahrnehmung. Schallphysik wie entstehen Töne? 3 Psychoakustische Wahrnehmung 31 Physikalische Grundlagen der Schallausbreitung 32 Physiologisches Gehörmodell 33 Psychoakustisches Wahrnehmungsmodell Multimediale Informationsverarbeitung: Psychoakustische

Mehr

Digital Signal Processing Audio Measurements Custom Designed Tools

Digital Signal Processing Audio Measurements Custom Designed Tools In einem idealen Hallraum, mit seinem diffusen Schallfeld, fällt der logarithmische Schallpegel linear mit der Zeit ab. Daher ist es sinnvoll, die akustischen Eigenschaften eines solchen Raumes durch einen

Mehr

Technik des digitalen Radios

Technik des digitalen Radios Technik des digitalen Radios Inhalt Geschichtliche Einordnung Analoges Radio RDS Radio Data System Digitales Radio - Vorteile/Nachteile Digitales Fernsehen als Radioersatz nutzbar? Übersicht gängiger Systeme

Mehr

Praktikum Hochfrequenztechnik

Praktikum Hochfrequenztechnik Praktikum Hochfrequenztechnik Fachreferat: Leistungsmerkmale von Spektrumanalysatoren Lars Dues Fachhochschule Aachen WS 07/08 Inhalt 1. Störfestigkeit 2 1.1 Spiegelempfangsstellen 2 1.2 ZF-Durchschlag

Mehr

Medien- Technik. Digital Audio

Medien- Technik. Digital Audio Digital Audio Medientyp digital audio representation Abtastfrequenz /sampling frequency Quantisierung (Bittiefe) Anzahl der Kanäle/Spuren Interleaving bei Mehrkanal Positiv/negativ Codierung operations

Mehr

Vorkurs Informatik WiSe 16/17

Vorkurs Informatik WiSe 16/17 Konzepte der Informatik Dr. Werner Struckmann / Stephan Mielke, Jakob Garbe, 14.10.2016 Technische Universität Braunschweig, IPS Inhaltsverzeichnis Bildcodierung Huffman scher Algorithmus Verlustbehaftete

Mehr

Schnelle Fouriertransformation (FFT)

Schnelle Fouriertransformation (FFT) Schnelle Fouriertransformation (FFT) Inhaltsverzeichnis 1 Schnelle Fouriertransformation (FFT)... 3 1.1 Das Realtime-Konzept der Goldammer-Messkarten... 3 1.2 Das Abtasttheorem oder Regeln für die Abtastung

Mehr

Verlustbehaftete Kompression. JPEG: Joint Photographic Experts Group

Verlustbehaftete Kompression. JPEG: Joint Photographic Experts Group Verlustbehaftete Kompression JPEG: Joint Photographic Experts Group ITU T8.1 definiert Zusammenarbeit von ITU, IEC, ISO Verfahren zur verlustbehafteten Bildkodierung (auch Verlustloser Modus vorhanden)

Mehr

Arne Heyda, Marc Briede, Ulrich Schmidt: Datenformate im Medienbereich, Fachbuchverlag Leipzig 2003, Kapitel 5

Arne Heyda, Marc Briede, Ulrich Schmidt: Datenformate im Medienbereich, Fachbuchverlag Leipzig 2003, Kapitel 5 5. Ton und Klang 5.1 Ton: Physikalische und physiologische Aspekte 5.2 Kompression von Audio-Signalen: MPEG-Audio 5.3 Audio-Datenformate: Übersicht 5.4 Klangerzeugung und MIDI Weiterführende Literatur:

Mehr

Was ist Lärm? Schall. Ton, Klang und Geräusch

Was ist Lärm? Schall. Ton, Klang und Geräusch Theoretische Grundlagen Was ist Lärm? Um das Phänomen Lärm verstehen zu können und um sich im Dschungel der später verwendeten Fachausdrücke nicht zu verlieren, sollte man über die wesentlichen physikalischen

Mehr

Medientechnik SS2011. Medientechnik 2011 Manfred Jackel Universität Koblenz-Landau

Medientechnik SS2011. Medientechnik 2011 Manfred Jackel Universität Koblenz-Landau Medientechnik SS2011 1 Karlheinz Brandenburg Bernhard Grill Harald Popp 2 Moving Pictures Experts Group Offizieller Name ISO/IEC JTC1/SC29/ WG11 Offizielle Homepage: http://www.chiariglione.org/mpeg/ H.261

Mehr

Arne Heyda, Marc Briede, Ulrich Schmidt: Datenformate im Medienbereich, Fachbuchverlag Leipzig 2003, Kapitel 5

Arne Heyda, Marc Briede, Ulrich Schmidt: Datenformate im Medienbereich, Fachbuchverlag Leipzig 2003, Kapitel 5 5. Ton und Klang 5.1 Ton: Physikalische und physiologische Aspekte 5.2 Kompression von Audio-Signalen: MPEG-Audio 5.3 Audio-Datenformate: Übersicht 5.4 Klangerzeugung und MIDI Weiterführende Literatur:

Mehr

Sitzung 5. Spektrogramm

Sitzung 5. Spektrogramm Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar: x-achse: Zeit (ms) - vgl. Dauer in der Perzeption y-achse: Frequenz (Hz) - vgl. Tonhöhe und Klangqualität in der Perzeption Schwärzungsgrad: Energie

Mehr

Klatschen vs. Pfeifen

Klatschen vs. Pfeifen Klatschen vs. Pfeifen Verwendung akustischer Signale zur Steuerung elektrischer Systeme Referat für das Projektlabor 2006/07 TU Berlin von Christian Rudat am Mo, den 6. November 2006 1 Übersicht Theorie

Mehr

Beispielhafte Testfragen (auch aus Schülerreferaten, Fragen können redundant sein, keine Audio Kompression berücksichtigt):

Beispielhafte Testfragen (auch aus Schülerreferaten, Fragen können redundant sein, keine Audio Kompression berücksichtigt): Beispielhafte Testfragen (auch aus Schülerreferaten, Fragen können redundant sein, keine Audio Kompression berücksichtigt): Was versteht man unter PCM, DPCM, DM, ADPCM? Skizze! Was versteht man unter PCM

Mehr

MP3-Grundlagen: Psychoakustik

MP3-Grundlagen: Psychoakustik MP3-Grundlagen: Psychoakustik Verschiedene Schallereignisse sind vom menschlichen HÄrsinn ( Psycho-Ohr ) nicht wahrnehmbar, weil sie von der Physik des Ohrs nicht zu einer entsprechenden Reizweiterleitung

Mehr

EDV-Anwendungen im Archivwesen II

EDV-Anwendungen im Archivwesen II EDV-Anwendungen im Archivwesen II 070472 UE WS08/09 Grundlagen der Digitalisierung Überblick Allgemeine Grundlagen der Digitalisierung anhand der Ton-Digitalisierung Abtastrate (Samplerate) Wortlänge (Bitrate)

Mehr

Arne Heyda, Marc Briede, Ulrich Schmidt: Datenformate im Medienbereich, Fachbuchverlag Leipzig 2003, Kapitel 5

Arne Heyda, Marc Briede, Ulrich Schmidt: Datenformate im Medienbereich, Fachbuchverlag Leipzig 2003, Kapitel 5 5. Ton und Klang 5.1 Ton: Physikalische und physiologische Aspekte 5.2 Kompression von Audio-Signalen: MPEG-Audio 5.3 Audio-Datenformate: Übersicht 5.4 Klangerzeugung und MIDI Weiterführende Literatur:

Mehr

DFT / FFT der Titel der Präsentation wiederholt (Ansicht >Folienmaster) Dipl.-Ing. Armin Rohnen, Fakultät 03, rohnen@hm.edu

DFT / FFT der Titel der Präsentation wiederholt (Ansicht >Folienmaster) Dipl.-Ing. Armin Rohnen, Fakultät 03, rohnen@hm.edu 1 Grundlagen Abtasttheorem Fenster Zeit - Frequenzauflösung Pegelgenauigkeit Overlap Mittelung 2 2 volle Schwingungen 32 Abtastwerte Amplitude = 1 Pascal Signallänge = 1 Sekunde Eine Frequenzline bei 2

Mehr

Übungsblatt 6 Audio Grundlagen

Übungsblatt 6 Audio Grundlagen Übungsblatt 6 Audio Grundlagen Aufgabe 1: Signalverarbeitung, Codierung a) Berechnen Sie die Größe der digitalen Rohdaten in Megabyte für eine 2 Minuten lange Audiospur in Stereo mit 44,1 khz Abtastrate

Mehr

SiSy1, Praktische Übung 3. Fourier-Analyse (periodischer Signale) kann als Fourier-Reihe 1 beschrieben werden:

SiSy1, Praktische Übung 3. Fourier-Analyse (periodischer Signale) kann als Fourier-Reihe 1 beschrieben werden: /5 Fourier-Analyse (periodischer Signale) Grundlagen Ein periodisches, kontinuierliches Signal x(t) der Periodendauer kann als Fourier-Reihe beschrieben werden: wie folgt ( ) = c k x t + e j k 2πf t k=

Mehr

Verwendung der neuen psychoakustischen Tonhaltigkeits- Analysen: Tonhaltigkeit (Gehörmodell) 1

Verwendung der neuen psychoakustischen Tonhaltigkeits- Analysen: Tonhaltigkeit (Gehörmodell) 1 07/18 Verwendung der neuen psychoakustischen Tonhaltigkeits- Analysen: 1 Mit der ArtemiS SUITE 9.2 stellt HEAD acoustics Ihnen eine neue, psychoakustische Möglichkeit zur Berechnung der Tonhaltigkeit zur

Mehr

Multimedia Systeme. Dr. The Anh Vuong. http: Multimedia Systeme. Dr. The Anh Vuong

Multimedia Systeme. Dr. The Anh Vuong.   http:   Multimedia Systeme. Dr. The Anh Vuong email: av@dr-vuong.de http: www.dr-vuong.de 2001-2006 by, Seite 1 Multimedia-Application Applications Software Networks Authoringssofware, Contentmangement, Imagesprocessing, Viewer, Browser... Network-Architecture,

Mehr

Übung 4: Spektrogramm

Übung 4: Spektrogramm ZHAW, DSV, FS2,. Einleitung Übung 4: Spektrogramm Mit einem Spektrogramm kann der zeitliche Verlauf des Spektrums von einem Signal dargestellt werden. Ein Spektrogramm besteht also aus vielen, sich allenfalls

Mehr

RelAtive SpecTrAl (RASTA) Processing of Speech

RelAtive SpecTrAl (RASTA) Processing of Speech RelAtive SpecTrAl (RASTA) Processing of Speech Paul Glad Mihai 23.11.06 Gliederung Einleitung Wieso RASTA? RASTA erläutert Probleme Modulationsspektrum von Sprache Methode RASTA erweitert Lin-Log Rasta

Mehr

Störgeräuschreduktion bei stimmhaften Sprachsignalen

Störgeräuschreduktion bei stimmhaften Sprachsignalen Störgeräuschreduktion bei stimmhaften Sprachsignalen Einkanaliges Mikrofon Nutzsignal Störgeräusche Allgemein: einkanalige Störgeräuschreduktion Folie 1 Gliederung Störgeräuschreduktion: Arten und Einsatzgebiete

Mehr

(Fast) Fourier Transformation und ihre Anwendungen

(Fast) Fourier Transformation und ihre Anwendungen (Fast) Fourier Transformation und ihre Anwendungen Johannes Lülff Universität Münster 14.01.2009 Definition Fouriertransformation F (ω) = F [f(t)] (ω) := 1 2π dt f(t)e iωt Fouriersynthese f(t) = F 1 [F

Mehr

äußeres Ohr Mittelohr Innenohr äußerer Gehörgang Amboss Steigbügel Hammer Trommelfell

äußeres Ohr Mittelohr Innenohr äußerer Gehörgang Amboss Steigbügel Hammer Trommelfell äußeres Ohr Mittelohr Innenohr äußerer Gehörgang Amboss Steigbügel Hammer Trommelfell Ohrmuschel Gleichgewichtsorgan Cochlea ovales rundes Fenster Eustachische Röhre Abb. 1: Schematischer Schnitt durch

Mehr

Subjektive Wirkung von Schall

Subjektive Wirkung von Schall Subjektive Wirkung von Schall FHNW HABG CAS Akustik 4h Version: 26. Februar 2009 Inhalt 1 2 3 Funktion des Ohres Subjektives Schallempfinden Objektive Masse (1) 1 Funktion des Ohres [3] Kap. 4.2.1, 4.2.2

Mehr

Die MPEG-Audiocodierverfahren

Die MPEG-Audiocodierverfahren Die MPEG-Audiocodierverfahren Johannes Hilpert Fraunhofer IIS, Erlangen http://www.iis.fraunhofer.de/amm 1 Themen Die MPEG-Audio Codierverfahren Wer oder was ist MPEG eigentlich? Von MPEG-1 bis MPEG-21

Mehr

Proseminar Kompressionsalgorithmen am Beispiel Mp3

Proseminar Kompressionsalgorithmen am Beispiel Mp3 Proseminar Kompressionsalgorithmen am Beispiel Mp3 Von S. Kortler und E. Yueksekdag bei Dr. Gerhard Schrott 22. Mai 2003 TUM Sommersemester 2003 Gliederung 1. Wozu eigentlich Audiokompression 2. Verschiedene

Mehr

Lauter Lärm. Lärm - eine Einführung! mil. Luftraumüberwachungsflugzeug

Lauter Lärm. Lärm - eine Einführung! mil. Luftraumüberwachungsflugzeug Lärm - eine Einführung! mil. Luftraumüberwachungsflugzeug Ing. LAMMER Christian Amt der Steiermärkischen Landesregierung, Fachabteilung 17C Leiter des Referates SEL schall-und erschütterungstechn. ASV

Mehr

Dämmkurven von Gehörschutz- Otoplastiken

Dämmkurven von Gehörschutz- Otoplastiken Dämmkurven von Gehörschutz- Otoplastiken Gwenolé NEXER g. n e x e r @ h e a r i n g p r o t e c h. c o m Mai 2011 Ins Deutsche übersetzt. Wir haben es als interessant erachtet, die unterschiedlichen Dämmkurven

Mehr

Inhaltsverzeichnis 1 Vorbemerkungen zur Sprachkommunikation Wahrnehmung und Messung von Schall... 9

Inhaltsverzeichnis 1 Vorbemerkungen zur Sprachkommunikation Wahrnehmung und Messung von Schall... 9 Inhaltsverzeichnis 1 Vorbemerkungen zur Sprachkommunikation...1 1.1 Einführung in das Buch, das Sprecher Hörer Modell...1 1.2 Bemerkungen zu Fachbegriffen...5 2 Wahrnehmung und Messung von Schall...9 2.1

Mehr

Audio-Kompression: MPEG

Audio-Kompression: MPEG Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp Audio-Kompression: MPEG Moving Pictures Experts Group Offizieller Name ISO/IEC JTC1/SC29/ WG11 Offizielle Homepage: http://www.chiariglione.org/mpeg/

Mehr

7. Sitzung. Kategoriale Wahrnehmung, McGurk-Effekt

7. Sitzung. Kategoriale Wahrnehmung, McGurk-Effekt K3.1 Phonetik und Phonologie II 7. Sitzung Kategoriale Wahrnehmung, McGurk-Effekt Hörfläche 2 Der stillste Raum der Welt Orfield Laboratories, USA 3 Wahrnehmung von Lautstärke Lautstärke wird in db (DeziBel)

Mehr

Test = 28 Punkte. 1: 2: 3: 4: 5: Punkte: Note:

Test = 28 Punkte. 1: 2: 3: 4: 5: Punkte: Note: ZHAW, DSV1, FS2010, Rumc, 1 Test 1 5 + 5 + 5 + 8 + 5 = 28 Punkte Name: Vorname: 1: 2: : 4: 5: Punkte: Note: Aufgabe 1: AD-DA-System. + 1 + 1 = 5 Punkte Das analoge Signal x a (t) = cos(2πf 0 t), f 0 =750

Mehr

ZHAW, DSV1, FS2010, Rumc, 1. H(z) a) Zeichnen Sie direkt auf das Aufgabenblatt das Betragsspektrum an der Stelle 1.

ZHAW, DSV1, FS2010, Rumc, 1. H(z) a) Zeichnen Sie direkt auf das Aufgabenblatt das Betragsspektrum an der Stelle 1. ZHAW, DSV, FS200, Rumc, DSV Modulprüfung 7 + 4 + 5 + 8 + 6 = 30 Punkte Name: Vorname: : 2: 3: 4: 5: Punkte: Note: Aufgabe : AD-DA-Umsetzung. + + +.5 +.5 + = 7 Punkte Betrachten Sie das folgende digitale

Mehr

Phone&sche Analysen (5b) Lautstärke, Lautheit, Tonhöhe, Tonheit. Sven Grawunder SoSe2014, Uni Leipzig

Phone&sche Analysen (5b) Lautstärke, Lautheit, Tonhöhe, Tonheit. Sven Grawunder SoSe2014, Uni Leipzig Phone&sche Analysen (5b) Lautstärke, Lautheit, Tonhöhe, Tonheit Sven Grawunder SoSe2014, Uni Leipzig Außen-, MiMel-, Innenohr Incus, Malleus, Stapes li. ; Q: hmp://o.quizlet.com/wolpn4jnnbm6em9w21pxvw_m.png

Mehr

Leitungscodierung. Modulation , G. Hirsch. bit. Slide 1

Leitungscodierung. Modulation , G. Hirsch. bit. Slide 1 Leitungscodierung bit Slide 1 Spektren leitungscodierter Signale bit Slide 2 Übertragungsfunktion des Cosinus- Rolloff Filters -f g f g Im Fall von NRZ ist: f g 1 2 T bit Slide 3 Augendiagramm Die nachstehenden

Mehr

Ludwig-Maximilians-Universität München Prof. Hußmann Digitale Medien 5-1. Schallwellen, d.h. schnelle Änderungen des Luftdrucks

Ludwig-Maximilians-Universität München Prof. Hußmann Digitale Medien 5-1. Schallwellen, d.h. schnelle Änderungen des Luftdrucks 5. Ton und Klang 5.1 Ton: Physikalische und physiologische Aspekte 5.2 Kompression von Audio-Signalen: MPEG-Audio 5.3 Audio-Datenformate: Übersicht 5.4 Klangerzeugung und MIDI Ludwig-Maximilians-Universität

Mehr

Digitales Video I. Wie wird Video am Computer codiert? Bilder. Bewegte Bilder. Ton. Videoformate. Auflösung Speicherung am Computer

Digitales Video I. Wie wird Video am Computer codiert? Bilder. Bewegte Bilder. Ton. Videoformate. Auflösung Speicherung am Computer Digitales Video I Wie wird Video am Computer codiert? Bilder Auflösung Speicherung am Computer Bewegte Bilder Interlacing Kompression / Codec Ton Audioformate / Codecs Videoformate Bilder Auflösung: z.b.:

Mehr

Digitalisierung und Kodierung

Digitalisierung und Kodierung Digitalisierung und Kodierung Digitale Medien liegen in digitaler Form vor Deshalb werden analoge Medien digitalisiert und geeignet kodiert Ziel der Digitalisierung: effiziente Berechnung wenig Verluste

Mehr

Spektrumanalyse. Inhalt. I. Einleitung 2. II. Hauptteil 2-8

Spektrumanalyse. Inhalt. I. Einleitung 2. II. Hauptteil 2-8 Fachhochschule Aachen Campus Aachen Hochfrequenztechnik Hauptstudium Wintersemester 2007/2008 Dozent: Prof. Dr. Heuermann Spektrumanalyse Erstellt von: Name: Mario Schnetger Inhalt I. Einleitung 2 II.

Mehr

Image Compression. Kompression. Beseitigung der unnötigen Daten... Redundanz. Vorlesung FH-Hagenberg SEM. Backfrieder-Hagenberg. Backfrieder-Hagenberg

Image Compression. Kompression. Beseitigung der unnötigen Daten... Redundanz. Vorlesung FH-Hagenberg SEM. Backfrieder-Hagenberg. Backfrieder-Hagenberg Image Compression Vorlesung FH-Hagenberg SEM Kompression Encoder Decoder Beseitigung der unnötigen Daten... Redundanz 1 Inhalte Redundanz Error-Free Compression Hufmann Coding Runlength Coding Lossy Compression

Mehr

Analyse von Audio Dateien

Analyse von Audio Dateien Analyse von Audio Dateien Mit diesem Modul können Sie automatische Berichte von Audio Dateien erstellen. Den Bericht können Sie mit Ihrem Browser öffnen und ausdrucken, archivieren etc. Mit einem Knopfdruck

Mehr

Prof. Dr. Stefan Weinzierl SNR V = P signal P noise

Prof. Dr. Stefan Weinzierl SNR V = P signal P noise Audiotechnik II Digitale Audiotechnik: 5. Tutorium Prof. Dr. Stefan Weinzierl 0.11.01 Musterlösung: 1. November 01, 15:50 1 Dither a) Leiten sie den SNR eines idealen, linearen -bit Wandlers her. Nehmen

Mehr

Herzlich Willkommen. zum Fachvortrag. von Harald Bonsel. ACOUSTICON Hörsysteme GmbH Ihr Spezialist für audiologische Messtechnik

Herzlich Willkommen. zum Fachvortrag. von Harald Bonsel. ACOUSTICON Hörsysteme GmbH Ihr Spezialist für audiologische Messtechnik Herzlich Willkommen zum Fachvortrag Mess-Signale und Mess-Strategien von Harald Bonsel ACOUSTICON Hörsysteme GmbH Ihr Spezialist für audiologische Messtechnik Harald Bonsel Fachvortrag: Messsignale und

Mehr

Image Compression. Kompression. Beseitigung der unnötigen Daten... Redundanz. Vorlesung FH-Hagenberg SEM. Backfrieder-Hagenberg. Backfrieder-Hagenberg

Image Compression. Kompression. Beseitigung der unnötigen Daten... Redundanz. Vorlesung FH-Hagenberg SEM. Backfrieder-Hagenberg. Backfrieder-Hagenberg Image Compression Vorlesung FH-Hagenberg SEM Kompression Encoder Decoder Beseitigung der unnötigen Daten... Redundanz 1 Inhalte Redundanz Channel Encoding Error-Free Compression Hufmann Coding Runlength

Mehr

AUDIOSIGNALE DEFINITION AUDIOSIGNALE FREQUENZBEREICH VON AUDIOSIGNALEN BEISPIELE (SIGNALE) DIGITALE & ANALOGE AUDIOSIGNALE

AUDIOSIGNALE DEFINITION AUDIOSIGNALE FREQUENZBEREICH VON AUDIOSIGNALEN BEISPIELE (SIGNALE) DIGITALE & ANALOGE AUDIOSIGNALE AUDIOSIGNALE DEFINITION AUDIOSIGNALE Ein Audiosignal, auch Tonsignal genannt, ist ein elektrisches Signal, das akustische Informationen transportiert. Bei vielen Geräten der Unterhaltungselektronik wird

Mehr

JT9 macht JT65 Konkurrenz Was ist und was kann der neue Digitalmodus JT9 von Joe Taylor K1JT?

JT9 macht JT65 Konkurrenz Was ist und was kann der neue Digitalmodus JT9 von Joe Taylor K1JT? JT9 macht JT65 Konkurrenz Was ist und was kann der neue Digitalmodus JT9 von Joe Taylor K1JT? Einsatzgebiet, Daten Dekodierung unter dem Rauschen? Betrieb mit WSJTX v 0.9 Praktische Ergebnisse JT9 / JT65

Mehr

Lossless Codecs. Fachbereich Medieninformatik. Hochschule Harz. Referat. Christian Menschel. Thema: Lossless Codecs

Lossless Codecs. Fachbereich Medieninformatik. Hochschule Harz. Referat. Christian Menschel. Thema: Lossless Codecs Fachbereich Medieninformatik Hochschule Harz Lossless Codecs Referat Christian Menschel 11487 Abgabe: 15.01.2007 Inhaltsverzeichnis Abkürzungen...I 1 Einleitung...1 2 Entropiekodierung...2 3 MPEG - 4 Audio

Mehr

Nachrichtentechnik [NAT] Kapitel 1: Einführung. Dipl.-Ing. Udo Ahlvers HAW Hamburg, FB Medientechnik

Nachrichtentechnik [NAT] Kapitel 1: Einführung. Dipl.-Ing. Udo Ahlvers HAW Hamburg, FB Medientechnik Nachrichtentechnik [NAT] Kapitel 1: Einführung Dipl.-Ing. Udo Ahlvers HAW Hamburg, FB Medientechnik Sommersemester 2005 Inhaltsverzeichnis Inhalt Inhaltsverzeichnis 1 Einführung 3 1.1 Motivation..................................

Mehr

Hörgeräte im Störgeräusch

Hörgeräte im Störgeräusch Hörgeräte im Störgeräusch Prof. Dr. Inga Holube Institut für Hörtechnik und Audiologie Fachhochschule Oldenburg/Ostfriesland/Wilhelmshaven Hören im Störgeräusch Hören in Ruhe (%) Verbesserung des Signal/Rausch-Verhältnisses

Mehr