Multimediatechnik / Audio Dipl.-Ing. Oliver Lietz Übersicht Person Organisatorisches Fachlicher Überblick
Übersicht Person Person Dipl.-Ing. Elektrotechnik TU Berlin Nachrichtentechnik / Akustik / Informatik Neuer Lehrauftrag seit einer Woche Mitarbeiter am Heinrich-Hertz Hertz-Institut Berlin Forschung/Entwicklung MPEG-Codierung Gründer / Partner nanocosmos gmbh Entwicklung und Beratung für f r Multimedia-Software http://www.nanocosmos.de/lietz/ lietz@nanocosmos.de
Schwerpunkte: Person Audioverarbeitung, Codecs,, Formate, Sprachverarbeitung Weniger: Musik-Synthesizer Geteilte Übung mit Dozent Michael Steppat Projekte Softwarecodecs (MP3, MPEG, H.264, DVD, HD) Softwareprodukte zur Video-/Audioverarbeitung Spezialentwicklungen für f r Kunden Forschungsnahe Entwicklung & Beratung
TranSpeaker Servergesteuerte Sprachsynthese (TTS) MP3-Streaming von übersetzten Texten Übersicht Organisatorisches
Veranstaltung Multimediatechnik / Audio, Übung 2 SWS, Doppel-Block 14täglich Frage: 4-fach4 fach-block-termin? Prüfungsleistungen? Bitte per Email anmelden! Inhalt Abtastung / Quantisierung Dateiformate
Material / Internet / Software Software: Audacity (Audio Editor, OpenSource) Waveosaur (Audio Editor, Freeware) VirtualDub (Freeware Video Editor) zusätzliche Plugins Samplitude (kommerziell) Audacity Audio-Editor mit Plugins, VST-kompatibel [OpenSource]
Audio-Editor, Freeware Waveosaur VirtualDub Video-Editor, auch zum Audio-Konvertieren [ OpenSource ]
Digitalisierung eines Signals Abtastung & Quantisierung = Puls-Code Code-Modulation (PCM) Datenmenge PCM Beispiel: 44.1 khz (Samples/Sekunde) 16 Bit/Sample Auflösung Datenmenge: 44100 * 2 Bytes = 88200 Bytes/Sekunde je Kanal
Wave (Microsoft) Dateiformate und Codecs Container/Kapselung verschiedener Formate (Codecs( Codecs) RIFF-Datenpakete (Chunks), ähnlich AVI chunkid chunksize wformattag (short) wchannels (unsigned short) dwsamplespersec (unsigned int) dwavgbytespersec (unsigned int) wblockalign (unsigned short) wbitspersample (unsigned short) MP3 Dateiformate und Codecs ISO-Standard Standard MPEG-Audio Layer 3 Verlustbehaftete Komprimierung Kein spezieller Container wie WAVE Elementarstrom :: nur Audio bzw. Video Audio+Video: : MPEG-Programmstrom Programmstrom Aufbau in Frames mit je gleichem Header: Syncword,, Bitrate, Samplingrate,
Unkomprimiert: PCM Audiocodierung Sampling-Frequenz Frequenz,, Auflösung (Bits) Z.B. 44,1 khz, 16 Bits Übung: Audiospur aus Video extrahieren VirtualDub.exe File/Open loriot.avi File/Save As WAV: loriot1.wav Abspielen mit MediaPlayer Warum ist nichts zu hören? h
Audioformate in AVI/WAVE AVI enthält verschiedene Formate, in diesem Fall: Video: XVID/MPEG-4 Audio: MP3 (MPEG Layer 3) Direct Stream Copy kopiert Daten direkt Full Processing Mode -> > in PCM konvertieren Save As WAV Brandt.wav: Aufgaben Bandpass-Filter, 1000-3000 Hz, Speichern als bandpass.wav Analyse/Frequenzanalyse, Screenshot speichern andere Filter ausprobieren: Abschnitt markieren, Amplifier / Verstärken rken / Normalisieren Loriot.wav: 2 Redner (z.b. Brandt und Sprecher) herausschneiden und speichern als Brandt1.wav, Kommentar.wav,, jeweils ca. 20 Sekunden Schneiden / Mischen: Redner abwechselnd kurze Stellen hintereinander sprechen lassen Jeweils auf rechten/linken Kanal legen (Stereo/Lautstärke rke anpassen)
Alias-Effekt Abtastfrequenz zu niedrig Aliasfrequenz Aufgabe für f Waveosaur (Aliasing) Datei öffnen, Brandt.wav Resampling: von 48 khz nach 5 khz Erst ohne, dann mit Filter!