Seminar Informatik SS 2002


Methoden der digitalen Audiobearbeitung


Von
Oliver R. Ahlemann
Mi7672


[Inhaltsverzeichnis]...[Digital Audio]...[Datenspeicherung und Formate]...[Audiobearbeitung]

1. Digital Audio
1.1 Begriffe
1.2 Darstellung von Tönen
1.3 Analog - Digital Wandlung
1.3.1 Vorbearbeitung des Signals
1.3.2 Abtastung
1.3.3 Quantisierung
1.3.4 Codieren
1.3.5 Zusammenfassend
1.3.6 Probleme der Digitalisierung
1.4. Digitalisierungsparameter und Datenmengen


1. Digital Audio

1.1 Begriffe

Zuerst sollen einige Begrifflichkeiten geklärt werden:

Was ist eigentlich Akustik?

Der Brockhaus sagt: Akustik die, Teilgebiet der Physik, die Lehre vom Schall.

Schall sind mechanischen Schwingungen. Sie breiten sich ich Longitudinalwellen aus. Akustische Signale sind Druckwellenschwankungen, die sich in Festkörpern, Flüssigkeiten und Gasen ausbreiten können. Im Vakuum können sich keine akustischen Signale ausbreiten.

Und was ist dann Audio?

Audio ist eine Sammelbezeichnung für alle akustischen Signale im Frequenzbereich des Hörschalls. Dieser liegt etwa zwischen 16 bis 16.000Hz. Unterhalb liegt der Bereich des Infraschall, oberhalb des Bereichs der Ultraschall.

Was ist ein Ton?

Ein Ton ist eine einzige harmonische Schwingung einer einzigen Tonfrequenz. Durch Vibration eines Materials, zum Beispiel einer Geigensaite oder einer Lautsprechermembran entstehen Luftschwankungen, die als Longitudinalwellen in der Luft weitergeleitet werden.

Die Qualitäten eines Tons sind die Frequenz (Tonhöhe) und die Amplitude (Lautstärke).


1.2 Darstellung von Tönen

Man kann generell Audiosignale auf zwei verschiedene Weisen betrachten. Einmal im Zeitbereich, als Schwingung oder Welle, und zum anderen im Frequenzbereich.

Eine Darstellung im Frequenzbereich erreicht man durch eine Fourieranalyse.

"Der Satz von Fourier besagt zusammenfassend, daß man jede periodische Schwingung, wie kompliziert sie auch sein mag, als die Überlagerung reiner, harmonischer Schwingungen darstellen kann, deren Grundfrequenz durch die Wiederholfrequrenz der periodischen Schwingung gegeben ist."

Abbildung 1: Harmonische Schwingung


Abbildung 2: Frequenzbereich

Um mal ein Gefühl für ein Frequenzspektrum zu bekommen hier einige Beispiele:

Abbildung 3: Geräusch

Abbildung 4: Klang

Abbildung 5: Knall


1.3 Analog - Digital Wandlung

Aufzunehmende Informationen und Vorgänge spielen sich in der Regel in einer analogen Umwelt ab. Besondere Kennzeichen von analogen Größen sind, daß diese Größen in der Regel ständig vorhanden sind und daß sie in der Regel zumindest innerhalb bestimmter Grenzen beliebige Werte - aus einer kontinuierlichen Werteskala annehmen können. Ein analoges, stetiges und kontinuierliches Audiosignal wie es zum Beispiel ein Musikinstrument erzeugt, kann in einem Rechner nicht direkt repräsentiert werden.

Digitale Signale sind stets nur Signalproben aus dem eigentlich zeitkontinuierlichen Signalverlauf und sie können zudem nur bestimmte Signalamplituden darstellen. Sie sind wert- und zeitdiskret.

Damit wird eine ganz erhebliche Informationsreduktion erreicht.. Jedoch muß der Anwender der Digitalisierung darauf achten, daß nur irrelevante, also nicht erkennbare oder unnötige Informationen oder redundante, also von der Elektronik wiederherstellbare Informationen aus dem Analogsignal entfernt werden, die Digitalisierung also für den Benutzer unmerklich verläuft. Dazu dienen die fein aufeinander abgestimmten Schritte bei der Digitaliserung:

Bei der Digitaliserung wird aus einem kontinuierlich verlaufenden, sich zeitlich ändernden elektrischen Signal eine diskrete Zahlenfolge von Nullen und Einsen, die als digitales Signal bezeichnet wird. Durch einen elektroakustischen Schallwandler (z.B. einem Mikrofon) können diese Schalldruckänderungen in elektrische analoge Signale umgewandelt werden. Diese werden dann in digitale Signale umgesetzt.

1.3.1 Vorbearbeitung des Signals

Zur Digitalisierung sind einige grundlegende Kenntnisse über das zu wandelnde Signal erforderlich: zunächst muß man wissen, in welchem Amplitudenbereich sich das Signal maximal bewegt und dann muß festgelegt werden, welche schnellsten Signaländerungen auf jeden Fall noch erhalten werden sollen. Im ersten Schritt der Vorbereitung wird daher eine angepaßte Amplitudenbegrenzung des Signals durchgeführt, damit der in der digitalen Darstellung verfügbare Bereich möglichst gut ausgenutzt wird. Das kann dazu führen, daß extreme Signalausschläge abgeschnitten werden.

Im zweiten Schritt der Vorbereitung erfolgt eine Frequenzbandbegrenzung des Eingangssignals auf weniger als die Hälfte der sog. Abtastfrequenz. (Theorem von SHANNON) Dies erfolgt mit einem Tiefpaßfilter, das schnellere Signaländerungen und damit hohe Signalfrequenzen aus dem zu digitalisierenden Signal endgültig entfernt.

Jetzt ist das Signal zur Digitalisierung bereit, es hat eventuell etwas von seiner Dynamik eingebüßt und hohe Frequenzen sind eventuell nicht mehr da, aber das sei hier wie in der Realität akzeptiert.

1.3.2 Abtastung

Jetzt wird das Signal mit Hilfe eines Abtastrasters zu bestimmten Zeitpunkten, die in konstantem zeitlichem Abstand voneinander sind, abgetastet. Der Wert zum Zeitpunkt der Abtastung wird jeweils solange gehalten, bis das Analogsignal erneut abgetastet wird. Die Abtastfrequenz entspricht genau der Rate pro Sekunde, mit der Signalproben aus dem analogen Signal entnommen werden sollen. Dies schreibt das Abtasttheorem vor. Die Größe der entstehenden Datenmenge ist proportional der Abtastrate. Weiterhin ist eine für den Verwendungszweck ausreichend genaue Quantisierung, also digitale Zahlendarstellung der Amplitudenwerte der Signalproben durchzuführen. Hier ist die sog. Amplitudenauflösung ebenfalls proportional zur Größe der entstehenden Datenmenge.

Abbildung 6: Abtastung

1.3.3 Quantisierung

Die Spannungswerte im Moment der Abtastung werden über einen Analog-Digital-Wandler in einen Zahlenwert umgewandelt (Quantisierung). Dabei wird auf ganze Zahlen gerundet.

Abbildung 7: Quantisierung

1.3.4 Codieren

Die Signalproben werden schließlich durch Binärzahlen, die bestimmten Abtastzeitpunkten zugeordnet sind, dargestellt und mittels einer Codezuordnung binär codiert.

Abbildung 8: Codierung

1.3.5 Zusammenfassend

Das besondere Kennzeichen einer digitalen Darstellung von Informationen ist also, daß aus einem zeitkontinuierlich ablaufenden Vorgang nur Signalproben genommen werden und daß diese Signalproben in ihrer Amplitude quantisiert werden, damit eine digitale Darstellung z. B. im Binärzahlensystem mit 0 und 1 computergerecht möglich wird.

1.3.6 Probleme der Digitalisierung

Zum einen wird man immer versuchen, den gesamten Dynamikbereich des Eingangssignals mit einer genügend großen Anzahl von Quantisierungsstufen abzudecken, damit weder das Signal begrenzt wird noch später ein sogenanntes Quantisierungsgeräusch (Q-Geräusch) auftritt. Zum anderen wird man die Abtastrate möglichst so hoch setzen, daß keine relevanten Signaländerungen unterschlagen werden. Das Quantisierungsrauschen kann man durch ein Verfahren namens Oversampling reduziert werden. Dabei wird während der Wiedergabe künstliche Zwischenwerte interpoliert. Hier ein Beispiel für 2fach-Oversampling. Zwischen jedem "echten" Wert kommt ein interpolierter dazu.

Abbildung 9: Quantvisierungsrauschen und Oversampling

Generell gilt, dass bei entsprechend großzügiger Einstellung der Digitalisierungsparameter keine sichtbaren oder hörbaren Beeinträchtigungen der Quellsignale eintreten müssen. Aus diesem Grunde gibt es für die unterschiedlichen Medien feste Digitalisierungsparameter, die weltweit benutzt werden.


1.4. Digitalisierungsparameter und Datenmengen

Mit der Zeit haben sich bestimmte Abtastraten und Quantisierungen weltweit durchgesetzt. Grundsätzlich gilt, daß die benötigte Übertragungsbitrate in Werten je Sekunde und die benötigte Speichermenge für einen Clip mit fester Länge, z. B. 10 Sekunden, direkt proportional ist der Abtastrate, die gewählt wurde, und ebenfalls proportional ist der Quantisierungsgenauigkeit, also der Anzahl der Binärstellen der Codeworte. Die benötigte Übertragungsbitrate je Sekunde lässt sich dann errechnen aus dem Produkt von Abtastrate in Hertz mal Bits/Abtastwert.

Für die Ermittlung der Speichergröße einer Datei muss zusätzlich noch mit der Länge des Clips in Sekunden multipliziert werden Beispiel für Mitschnitt eines Live-Konzerts von 60 Minuten Länge in CD-Qualität: Abtastrate beträgt 44,1kHz, linker und rechter Tonkanal werden mit jeweils 16bit quantisiert.

Daraus folgt: 44,1kHz * 2 * 16bit * 60 * 60 s = 5,1 Gigabit = 635 Megabyte Digitalisierungsparameter für Audio:

Übliche Abtastraten sind:

und übliche Quantisierung erfolgen mit 8 oder 12 Bit bei PC, 16 Bit bei CD und PC und 24 Bit im Tonstudio.

Tabelle 1: Datenmengen bei der Digitalisierung

44,1 kHz
22 kHz
11 kHz
16 Bit
1408 kBit
704 kBit
352 kBit
12 Bit
1056 kBit
528 kBit
264 kBit
8 Bit
704 kBit
352 kBit
176 kBit

 


[Inhaltsverzeichnis]...[Digital Audio]...[Datenspeicherung und Formate]...[Audiobearbeitung]