Die MPEG-Audiocodierverfahren

Die MPEG-Audiocodierverfahren Johannes Hilpert Fraunhofer IIS, Erlangen http://www.iis.fraunhofer.de/amm 1

Themen Die MPEG-Audio Codierverfahren Wer oder was ist MPEG eigentlich? Von MPEG-1 bis MPEG-21 Die Anfänge in Erlangen MPEG-1 bis MPEG-4 Audio MPEG-4 Audio Features Bitratenbereiche Aktuelle Entwicklungen 2

Was ist MPEG? Die Moving Pictures Expert Group als Teil der ISO sorgt für die Standardisierung von Technologie zum Umgang mit Multimediadaten Die weltweit beteiligten Firmen und Forschungseinrichtungen verpflichten sich, die Technologie Fair, reasonable and nondiscriminatory zu lizenzieren Es werden offene Standards geschaffen Zukunftssicherheit durch Kontrolle der Formate durch eine weitgehend unabhängige Organisation Interoperabilität von Produkten 3

Von MPEG-1 bis MPEG-21 MPEG-1 (1992): Digitale A/V Codierung in VHS -Qualität, Ersatz der analogen Medien, begrenzte Datenrate (1.5 Mbit/s) MPEG-2 (1994): A/V Codierung für z.b. digitales Fernsehen in HDTV- Qualität, DVD. Mehrkanalaudio. MPEG-4 (1999): Codierung natürlicher und künstlicher multimedialer Inhalte, skalierbar, objektorientiert MPEG-7 (2001): Multimedia content description, Metadaten MPEG-21 (2001): Authoring, Vertrieb, Digital Rights Management 4

Vor MPEG-1: Die Entwickler in Erlangen 1987 5

Vor MPEG-1: ASPEC, der Vorläufer von mp3 (1991) 6

MPEG-1 Audio (1992) 3 Audiocodierverfahren wurden als Layer 1 bis Layer 3 standardisiert. Komplexität und Codiereffizienz nehmen zu den höheren Layern zu. Die Zahl der Kanäle ist auf zwei begrenzt Abtastfrequenzen von 32 bis 48 khz Layer 1: selten verwendet, Philips DCC Layer 2 (mp2): Rundfunkzuspielung, DAB Layer 3 (mp3): Das weltweit verbreitetste Codierverfahren, Worldspace-Radio 7

MPEG-2 Audio (1994) Erweiterung von Layer 1 bis 3 auf: Multikanalfähigkeit (bei mp3 nie im Markt) niedrigere Abtastfrequenzen und Bitraten AAC (Advanced Audio Coding, 1997): Entwickelt von Fraunhofer, AT&T, Dolby, Sony Verzicht auf Rückwärtskompatibilität zu mp2/mp3 Doppelte Codiereffizienz verglichen mit mp2 Multikanalfähig (bis zu 48 Kanäle) Abtastfrequenzen über 192 khz für High Resolution Audio Verwendet z.b. im japanischen HDTV-Fernsehen 8

MPEG-2 Audio AAC-Multichannel für HDTV Japan 9

MPEG-4 Audio (1999) Verschiedene Sprach- und Audiocoder für unterschiedliche Anwendungsbereiche: High Quality Audio: AAC mit zusätzlichen Tools (PNS), Apple s MusicStore Download-Service verwendet MPEG-4 AAC Low Delay Audio für bidirektionale HiFi-Telefonie: AAC Low Delay High Efficiency Audio: AAC + SBR für gute Audioqualität bei niedrigen Bitraten Skalierbares Audio: AAC mit Sprachcoderkern Breitband/Telefonsprachcoder: CELP Extrem niedrige Bitraten: Parametrische Coder (HVXC für 2 kbit/s Sprache) Music Synthese, Structured Audio 10

MPEG-4 Audio Features Skalierbare Codierung: Verschiedene Bitraten/Qualitätstufen sind als Layer hierarchisch in einem Audiostrom untergebracht. Der Strom kann vor oder während der Übertragung in seine Qualitätsstufen zerlegt werden. Anwendung: Internet-Streaming, Musikdownload Beispiel für die Bitraten: Beispiel: AAC mit 24 mono + 16 stereo + 16 stereo erlaubt die Decodierung von 24 mono, 40 und 56 stereo Sprachcore für sehr niedrige Bitraten möglich (z.b. 6 kbps CELP + 18 kbps AAC) 11

MPEG-4 Audio Features (2) AAC Low Delay: Eine typische Eigenschaft von Audiocodern ist die Signalverzögerung, die durch die Codierung entsteht. Typische Werte sind 100 bis 200 ms (für mp3 und AAC) im realen Betrieb AAC Low Delay ist eine speziell auf niedrige Verzögerung getrimmte AAC Variante, die es erlaubt die Verzögerung auf 40 ms zu reduzieren. Die erreichbare Qualität ist vergleichbar mit mp3 Die Verzögerung liegt im Bereich der Sprachcoder und erlaubt ungetrübte bidirektionale Kommunikation. 12

MPEG-4 Audio Features (3) Fehlerrobustheit: Problem: Durch die hohe Kompression steigt der Informationsgehalt eines einzelnen Bits. Fehler bei der Übertragung wirken sich daher umso stärker aus. MPEG-4 bietet verschiedene Ansätze, Übertragungsfehler zu verhindern, oder ihren Einfluß zu verringern: Unempfindliche Bitstromsyntax (Error Resilience) Fehlerverschleierung (Error Concealment) Fehlerschutz durch Redundanz (Unequal Error Protection) Hörbeispiel Error Robustness 13

Bitratenbereiche Typische Bitraten für 2 Kanäle bei sehr guter Audioqualität (near CD bis CD-Quality): mp2: 192..256 kbit/s mp3: 128..160 kbit/s MPEG-2 AAC: 96..128 kbit/s MPEG-4 AAC: 64..96 kbit/s MPEG-4 AAC+SBR: 48..72 kbit/s 14

Aktuelle Entwicklungen Ultra Low Delay Coding 6 ms Verzögerung bei ca. 70 kbit/s pro Kanal Anwendung: Drahtlose Mikrofone, Drahtlose Beschallung mp3 on mp4 Derzeit wird mp3 als Codieralgorithmus in MPEG-4 integriert. Multikanalfähigkeit Kombination mit den leistungsfähigen MPEG-4 Videocodern 15

Vielen Dank für ihre Aufmerksamkeit Fragen? 16