Soundbearbeitung mit Audacity office@wofi.at www.wofi.at
Inhaltsverzeichnis Inhaltsverzeichnis 0. DIGITAL AUDIO...4 0.1. Einleitung...4 0.2. Grundlagen...4 0.3. Das Ohr...4 0.3.1. Tonhöhenempfindung...4 0.4. Mikrofontechnik...5 0.4.1. Dynamische Mikrofone Tauchspulenmikrofone...5 0.4.2. Kondensatormikrofone...5 0.5. Der Computer im Tonstudio...6 0.5.1. Audio Aufnahmen...6 0.5.2. Aufnahme von Musik und Soundeffekten...6 0.6. Von analog zu digital...7 0.6.1. Sampling...7 0.6.2. Quantisieren...7 0.7. Effekte/Filter...7 0.8. Soundformate...8 0.9. Fachbegriffe in der digitalen Audiotechnik...8 office@wofi.at www.wofi.at 2
0. 0.1. Einleitung Mit Audacity können Sie Audiodaten nachbearbeiten. Sie können eine Reihe von Audiodateien öffnen, aufnehmen, verbessern und mit Effekten versehen. Audacity ist Open Source was soviel bedeutet wie, Sie können es frei aus dem Internet herunterladen und installieren. Die offizielle Seite von Audacity finden Sie unter audacity.sourceforge.net. Eine genaue Dokumentation können Sie unter audacity.sourceforge.net/help/documentation (derzeit nur in Englisch) herunterladen. Hinweis: MP3 Dateien können Sie in Audacity nur mithilfe der Open Source Software Lame bearbeiten. Diese muss zuerst auf ihrem System installiert werden. Lame können Sie im Internet unter lame.sourceforge.net herunterladen. In diesem Skript beschäftigen wir uns mit den allgemeinen Grundlagen der digitalen Tontechnik und nicht mit Audacity im speziellen. 0.2. Grundlagen Die Amplitude zeigt die Intensität einer Schallwelle. Frequenz ist definiert als die Anzahl von Schwingungen pro Sekunde und wird mit der Einheit Hertz (Hz) angegeben. Das hörbare Frequenzspektrum reicht bei einem erwachsenen Menschen von etwa 20 Hz bis 16 khz und nimmt mit zunehmendem Alter ab. Wellenlänge: der Abstand zweier benachbarter, mit gleicher Phase schwingender Teilchen. Sie errechnet sich aus der Schallgeschwindigkeit pro Sekunde geteilt durch die Frequenz. Tiefe Töne haben eine niedrige Frequenz und somit auch eine größere Wellenlänge: ein 20 Hz Basston hat ZB eine Wellenlänge von rund 17 Metern. Ein komplexer Ton besteht nicht nur aus einer einzelnen Schwingung, sondern aus allen Vielfachen seiner Grundschwingung, den Oberwellen. Diese Gesamtheit aller Schwingungen macht die Klangfarbe aus, die eine Stimme oder ein Instrument als typisch kennzeichnen. 0.3. Das Ohr Frequenz und Schalldruck werden im Gehirn als Lautstärke und Tonhöhe empfunden. Das Ohr reagiert auf Druckschwankungen des Schallfeldes welche in Nervenreize umgewandelt werden. 0.3.1. Tonhöhenempfindung Die Basilahnmembran besteht aus einer quer im Schneckengang gespannten großen Anzahl (ca. 24.000) von Fasern. Bei Schalleinfall werden die Reize von dem Trommelfell über die Gehörknöchelchen auf die Membran des ovalen Fensters geleitet. Die Druckwellen werden in der Lymphflüssigkeit weitergeleitet. Es werden die Fasern erregt, deren länge bedingter Eigenresonanz der Frequenz der Druckschwankung entspricht. office@wofi.at www.wofi.at 3
Die Tonhöhenempfindung ändert sich mit dem Logarithmus der Frequenz. Folglich werden Tabellen immer logarithmisch dargestellt. Bei großen Lautstärken können auf der Basilaarmembran auch benachbarte Fasern erregt werden, was dann zu einer Tonhöhenempfindung nach oben führen kann. 0.4. Mikrofontechnik 0.4.1. Dynamische Mikrofone Tauchspulenmikrofone Das dynamische Mikrofon arbeitet nach dem Induktionsprinzip. Das Bild zeigt einen Dauermagneten, in dem durch Schalleinwirkung eine Spule bewegt wird. Die Membran sitzt an der Außenseite der Spule. Der Schall bringt die Membran zum schwingen, wodurch die Spule im Magnetfeld bewegt wird (wir erinnern und an den Physikunterricht: Wenn ein Leiter in einem Magnetfeld bewegt wird, wird Spannung induziert). Diese sich dauernd ändernde Induktionswechselspannung ist unser Nutzsignal. Man kann sich vorstellen, dass hierbei nur wenige Millevolt pro Pascal (Luftdruck) an Ausgangsspannung induziert werden und dadurch diese Spannung sehr störanfällig ist. Diese Empfindlichkeit wird als sog. Feld- Leerlaufübertragungsfaktor angegeben. Nachteile: Es werden Widerstände, Verluste und Ungenauigkeit verursacht durch: Membran (Trägheit) Gewicht der Spule/Membran Magnetfeld (bremst) Vorteile: Robust Preiswert 0.4.2. Kondensatormikrofone Eine der beiden Kondensatorplatten dient als Membran, die sich zur anderen Platte (fest) bewegt. Diese Bewegung wird durch die Schallschwingung verursacht. Dadurch ändert sich der Abstand der beiden Elektroden, woraus sich eine proportionale Kapazitätsänderung des Kondensators ergibt. Um eine der Kapazitätsänderung proportionale Spannung zu erhalten, benötigt man an den Elektroden eine Polarisationsspannung. Die sog. Phantomspeisung. Die Abweichungen von dieser Spannung ist unser Nutzsignal. Kondensatormikrofone sind, gegenüber dynamischen Tauchspulenmikrofonen, mechanisch und akustisch viel empfindlicher. Obige Zeichnung zeigt am Ende des Mikrofons einen Vorverstärken: folglich ist auch die Ausgangsspannung (und damit der Pegel) weitaus höher als bei den dynamischen Mikrofonen. Allerdings braucht dieser Verstärker eine Betriebsspannung, die ebenfalls der Phantomspeisung entnommen werden kann. Weiterhin ist zu bemerken, dass die Membran der Kondensatormikrofone wesentlich schneller schwingen kann (da hier keine Spule bewegt werden muss) und dadurch ein besserer Frequenzgang, vor allem bei hohen Frequenzen, erzielt wird. office@wofi.at www.wofi.at 4
0.5. Der Computer im Tonstudio In der modernen Tonstudiotechnik wird der Computer als Steuereinheit verwendet, um sich die Arbeit zu erleichtern. Dies bedeutet aber nicht, dass einem irgendeine Arbeit abgenommen wird. Meistens wird der Computer als Sequenzer oder als Mischpultautomation verwendet. 0.5.1. Audio Aufnahmen Sprachaufnahmen: Ein qualitativ vernünftiges Mikrofon, ein kleines Mischpult und ein digitaler 2-Spur DAT Recorder reichen in den meisten Fällen aus man braucht also oft nicht einmal ein Studio zu mieten, wenn doch, dann reicht auf jeden Fall eine Sprachkabine oder das dort zur Verfügung stehende kleinste Studio. Wichtig: Du willst professionell arbeiten, nimm also auch eine(n) Sprecher(in) der(die) vernünftig tönt... Achte darauf, dass die Stimme gut verständlich ist, angenehm klingt und der Text grammatikalisch fehlerfrei ist. Ach ja, Englisch wird ja auch recht gerne verwendet: hol dir jemanden, der sprachlich sattelfest ist. Eine hohe Sprachverständlichkeit erreichst du durch Komprimierung und Anhebung der Frequenzen des Sprachbandes. Für Effekte kannst du beliebig in die elektronische Trickkiste greifen achte jedoch auf eine weiterhin gute Sprachverständlichkeit. Denke daran, dass du beim Anschließen deiner Quelle eventuell zuerst die Parameter für die Toneingabe des Kontrollfeldes Ton (oder Monitore/Ton, etc.) einstellen musst (check dies mal aus, falls du einfach nichts hören kannst...). 0.5.2. Aufnahme von Musik und Soundeffekten Je nach Komplexität geht es hier von einfachen Synthieklängen bis zur Aufnahme ganzer Orchester. Ab einer gewissen Komplexität ist man auf gute Musiker, Musikprogrammierer und Techniker angewiesen. Das Budget wird dabei den Rahmen vorgeben. Bestehende Sounds: Es gibt inzwischen unzählige CDs mit Effekten, Sounds und ganzen Musikstücken zur Verwendung. Achtung: erkundige dich nach den Rechten für die Verwendung Equipment: In einfachsten Fall: Audio CD eingebaut für Sound-In oder das oftmals mit dem Rechner mitgelieferte Mic und der PC-Lautsprecher für Sound-Out. Wenn du öfters mit Sound arbeitest und deine Qualitätsansprüche etwas gehobener sind, so solltest du vor deinem Eingang am besten ein kleines Mischpult zur besseren Verwaltung der Audio-Quellen angeschlossen haben. Am Ausgang empfiehlt es sich, entweder einen hochwertigen Kopfhörer, Aktiv-Lautsprecher oder einen Verstärker plus passive Lautsprecher anzuschließen. office@wofi.at www.wofi.at 5
0.6. Von analog zu digital 0.6.1. Sampling SOUNDBEARBEITUNG Ein Signal muss mindestens mit der doppelten in ihm vorkommenden Frequenz abgetastet werden, um aus diesen Abtastwerten das Originalsignal wiedergewinnen zu können. Hierbei besteht zwischen dem gesampleten und dem wiedergewonnenem Signal kein Unterschied. 0.6.2. Quantisieren Pam Signal ist noch wertekontinuierlich wird deshalb jetzt einem Raster untergeordnet. Je nach Anzahl der für Quantisierungsstufen möglichen Bits erreicht man eine mehr oder weniger genaue Auflösung. Beim Quantisieren entstehen Fehler, die sich ähnlich verhalten, wie das Rauschen bei analogen Systemen. Diese sog. Quantisierungsfehler betragen max. eine ½ Quantisierungsstufe. 0.7. Effekte/Filter Delay: eine einmale Wiederholung einer bestimmten Länge und Intensität. Echo: ähnlich jedoch mit mehreren Wiederholungen bis zum Ausklingen. Reverb: ein Hallgerät für Einstellungen reichend von einem Leeren Raum bis zu Outer Space. FadeIn/FadeOut: ein- und ausblenden der Lautstärke in drei Stufen (Slow, Medium und Fast) Mix: das zusammenmischen mehrerer Spuren zu einer Mono oder Stereo Spur. Durch anklicken des Buttons Deluxe Mixer erscheint ein Dialog zur Anpassung des Stereo Panoramas. Normalize: die Lautstärke wird auf ein Maximum angehoben, ohne das Soundfile zu verzerren. Prinzipiell gilt immer: möglich hochpegelig, jedoch ohne Verzerrung, aufnehmen. Versuche nicht eine schlechte (z. B. rauschige Aufnahme) derartig aufzupeppen. Reverse: dreht die Selektion um (für Dämonenbeschwörungen und so) Tempo: verändern der Geschwindigkeit (das heißt der Länge) der Selektion ohne Änderung der Tonhöhe (maximal doppelt/halb). Noise Gate: Signale unter einer bestimmten Lautstärkengrenze (Treshold) werden nicht mehr durchgelassen, derartig können Störteppiche reduziert werden. Attack bezeichnet die Zeitdauer, welcher der Effekt bis zum Einsetzen seiner Wirksamkeit braucht. Wie bei den meisten Effekten braucht es Fingerspitzengefühl, damit die Sache nicht unnatürlich wirkt. Envelope: das individuelle Verändern des Lautstärkenverlaufs durch einsetzen und positionieren von Ankerpunkten. Neue Punkte werden erstellt durch anklicken der gewünschten Position. Besteht noch keine Hüllkurve, so wird bei maximaler Lautstärke ein linearer Verlauf eingefügt. office@wofi.at www.wofi.at 6
0.8. Soundformate Anbei finden Sie einige gängige Audioformate: AIFF: Audio Interchange File Format,.aif, häufige Verbreitung unter Macintosh Computer Wave:.wav, häufige Verbreitung auf Windows Betriebssystem QuickTime: erlaubt auch Mehrkanal Soundfiles. Es handelt sich hier eigentlich um Sound Movies. Sun.au: häufige Verbreitung auf Unix Betriebssystemen Sound Designer II: ein in der professionellen Audio Welt oft verwendetes Format MP3:.mp3 komprimiertes Format OGG: Open Source, häufige Verbreitung auf Unix/Linux Betriebssystemen IFF 8SVX.iff, häufige Verbreitung unter Amiga Computer 0.9. Fachbegriffe in der digitalen Audiotechnik Sample: Probe eines Signales; im heutigen Sprachgebrauch bezeichnet dieser Begriff eine abgespeicherte Digitalaufnahme Sampling Frequenz: die Anzahl der Werte, die als Proben pro Sekunde entnommen werden (Frequenzwert in Richtung der horizontalen Zeitachse). Sampling: bezeichnet den Prozess, tonfrequente und zeitkontinuierliche Analogsignale in eine Folge digitaler Abtastwerte umzuwandeln und diese digitalen Audio-Daten (mit einer bestimmten Dauer und Bandbreite) ins RAM oder auf Festplatte aufzunehmen. Nach der Aufnahme, können diese Daten jederzeit wieder geladen, abgespielt, verändert und auch verfremdet werden und als ganz neuer Klang wieder abgespeichert werden. Quantisierung: die eigentliche Übersetzung der Signale in binäre Information. Wird in Bits angegeben. Beschreibt die Anzahl Bereiche die unterschieden werden können (Amplitudenwert in Richtung der Vertikalen). Je höher der Wert, desto hochwertiger ist die Erfassung. Je höher die Quantisierung, desto kleiner die Störgeräusche (Quantisierungsrauchen). Mit größeren Werten steigt die Qualität, jedoch auch der Speicherbedarf. Die Firmen sind bestrebt, die enormen Speichermengen möglichst reduzieren zu können. office@wofi.at www.wofi.at 7