24 Bit

Qualitätssteigerung bei Digitalaufnahmen

Das Datenformat einer Audio-CD ist festgelegt, die Auflösung beträgt 16 Bit. Trotzdem existieren viele Geräte, deren Wandler und interne Verarbeitung mit 20 Bit und mehr operieren. Macht das überhaupt Sinn?


Grundlagen
Bei der Digitalisierung wird ein analoges Signal in bestimmten Zeitabständen abgetastet. Zu jedem dieser Zeitpunkte wird der Pegel des Signales gemessen und als Zahlenwert dargestellt. Für diesen Zahlenwert stehen beim CD-Format 16 Bit zur Verfügung, es sind damit 2 hoch 16, also 65536 unterschiedliche, diskrete Zahlenwerte darstellbar. Da es nur ganze Zahlen gibt, entsteht ein Fehler in den Bereichen, in denen das ursprüngliche Analogsignal zwischen den darstellbaren Zahlenwerten lag. Dieser Fehler ist bei jedem Abtastwert unterschiedlich. Die Differenz zum Originalwert scheint dem Signal überlagert zu sein und ist als Quantisierungsrauschen oder als rauher Klang wahrnehmbar. Bei einer Auflösung von 16 Bit befindet sich das Quantisierungsrauschen jedoch theoretisch 96 dB unterhalb der Vollaussteuerung, ist also kleiner als die meisten anderen Störsignale der zu digitalisierenden Aufnahme.

A/D-Wandlung
Bei der A/D-Wandlung darf im Gegensatz zur analogen Aufnahme keinerlei noch so kurze Übersteuerung erfolgen. Der darstellbare Zahlenbereich endet bei 0dB, jeder Wert darüber wird ebenfalls als 0dB dargestellt. Akustisch äußert sich das als äußerst unangenehmes, hartes Clipping.
Um sicher zu sein, daß im Verlauf der Aufnahme keine übersteuerung auftritt, sollte man A/D-Wandler immer sehr vorsichtig aussteuern und Reserven lassen, den sogenannten Headroom. Dadurch wird der darstellbare Zahlenbereich aber gar nicht voll ausgenutzt, von den 16 Bit werden also vielleicht nur 14 verwendet. Daher bietet sich für die Digitalisierung ein 20-Bit-Wandler an. Auch bei diesem ist ein Headroom nötig, aber von den 20 Bit bleiben dann beispielsweise immer noch 18 übrig. Das Signal kann mit verschiedenen Algorithmen, z.B. Dithering, Noise Shaping oder Super Bitmapping auf 16 Bit heruntergerechnet werden, die dann aber bis auf das letzte Bit ausgereizt sind. Die Aufnahmen erhalten dadurch maximale Dynamik und Auflösung.

Bearbeitung
Bei der Bearbeitung eines digitalen Signales wird mit den Zahlenwerten, aus denen das Signal besteht, gerechnet. Bei jedem Rechenvorgang entstehen Nachkommastellen, die im 16-Bit-Format jedoch nicht dargestellt werden können. Also müssen die Werte auf ganze Zahlen gebracht werden, was durch simples Abschneiden, Runden oder Redithering erfolgen kann. Dabei entsteht - ähnlich wie bei der Abtastung - ein Fehler, der sich durch Quantisierungsrauschen bzw. einen rauhen Klang bemerkbar macht. Mit jedem Rechenvorgang entsteht ein neuer Fehler, und alle entstehenden Fehler addieren sich. Bei intensiver Bearbeitung im Mastering (Equalizer, Compressor, Limiter etc.) oder in einem digitalen Mischpult würde nicht viel von der ursprünglich guten Signalqualität übrig bleiben.
Die entstehenden Nachkommastellen bedeuten im digitalen Bereich eine Erhöhung der Wortbreite. Wenn diese nun nicht sofort wieder auf 16 Bit reduziert, sondern mitgeführt wird, entsteht auch kein Fehler. Allerdings ist auch eine größere Wortbreite irgendwann ausgereizt. Bei 20 oder 24 Bit und nur wenigen Bearbeitungsschritten ist der Fehler jedoch so klein, daß er nicht mehr hörbar ist, denn das niederwertigste Bit eines 24 Bit Signals liegt bei minus 144 dB. Zwischenschritte einer digitalen Bearbeitung sollten also in diesem Format gespeichert werden.
Bei aufweniger Bearbeitung in digitalen Mischpulten oder anderen DSP-Prozessen ist allerdings eine interne Wortbreite von 32 Bit keine Seltenheit, und in DSP-Algorithmen können sogar bis zu 72 Bit erreicht werden.
Erst, wenn der gesamte Bearbeitungsprozeß abgeschlossen ist, sollte auf die für die CD benötigten 16 Bit heruntergerechnet werden. Dann wird auch hier das Format voll ausgenutzt, und es kann maximale Dynamik und Auflösung erzielt werden.

24 Bit Floating Point
Eine Besonderheit stellt das 24 Bit Floating Point Format dar. Wie beim Taschenrechner mit Fließkomma-Funktion können hier Nachkommastellen dargestellt werden, wenn sich vor dem Komma weniger Stellen befinden. Das kommt unserem Hörempfinden stark entgegen, denn Quantisierungsrauschen wird bei hohen Pegeln vom Signal verdeckt, ist bei leisen Passagen aber umso stärker hörbar. Leise Passagen bedeuten aber kleine Zahlen und somit wenige Stellen vor dem Komma, so daß hier viele Nachkommastellen mitgeführt werden können. Die Folge ist eine fast unendlich große Dynamik während der Bearbeitung. Danach wird auch hier wieder mit den schon beschriebenen Methoden auf 16 Bit konvertiert. Das Floating-Point-Format findet beispielsweise im Programm Samplitude von SEK'D Verwendung.

Zum Schluß wieder 16
Bei allen vorgestellten Verfahren hat die abschließende Konvertierung auf 16 Bit eine große Bedeutung. Wie bereits angesprochen, existieren dafür mehrere Verfahren. Das Abschneiden der Nachkommastellen oder die mathematische Rundung sind dabei die einfachsten. Sie erzeugen ein 16-Bit-Signal, das jedes Bit nutzt. Allerdings gibt es andere Verfahren, die das Format noch weiter ausreizen können. Diese stellen wir Ihnen im folgenden vor. Die Methoden haben zum Ziel, das vorhandene Quantisierungsrauschen weniger auffällig zu gestalten bzw. ein wenig der 20-Bit-Qualität in die 16 Bit herüber zu retten.

Dithering
Zu den vier niedrigsten Bits, die in das 16-Bit-Signal nicht übernommen werden können, wird eine ebenfalls vierstellige Zufallszahl addiert. Danach wird das Signal nach dem 16. Bit abgeschnitten. Es ergibt sich der Effekt, daß die Zufallszahlenfolge gemeinsam mit den vier niedrigsten Bits des 20-Bit-Signales das niedrigste Bit des neuen 16-Bit-Signales, das LSB, moduliert. Somit wird das LSB aufgrund des Einflusses der musikalischen Information gesetzt, die in den unteren vier Bits enthalten war.
Zufallszahlen mit der Größe von einem LSB werden als Rauschen mit einem Pegel von 96 dB unter Vollaussteuerung hörbar. Rauminformationen und Decayphasen im Musiksignal können nach dem Dithering aber noch bis minus 115 dB hörbar sein, obwohl das Signal nur 16 Bit umfaßt. Es sind Informationen hörbar, deren Pegel kleiner ist als das Dither-Rauschen.

Noise Shaping
Bei Rauschen mit minus 96 dB handelt es sich um einen sehr geringen Pegel. Trotzdem sind einige Toningenieure in der Lage, das Dither-Rauschen selbst bei normalen Abhörpegeln zu hören. Zwar hilft es, subtile Informationen wahrzunehmen, es legt aber gleichzeitig einen leichten Schleier über die Musik, der diese Informationen zum Teil wieder verdeckt.
Noise Shaping formt das Frequenzspektrum dieses Rauschens nun derart, daß es schwächer zu hören ist. Dazu wird es wie mit einem Equalizer bearbeitet, so daß es den gleichen Durchschnittspegel behält, aber von den Frequenzbereichen, in denen das Gehör am empfindlichsten ist (ca. 3 kHz), in unempfindlichere verlagert wird (10 bis 22 kHz). Dazu ist ein Filter höherer Ordnung notwendig, dessen Frequenzkurve mehrere Tiefpunkte an den Stellen aufweist, an denen das Gehör besonders empfindlich ist. Dazu bedarf es einer höheren Rechenleistung, das Resultat überzeugt aber durch erstaunliche Rauschfreiheit. Oft hören sich Signale nach Noise Shaping obertonreicher an. Dieser Effekt wird durch die Betonung der hohen Frequenzanteile des Rauschens selbst hervorgerufen. Die besten Prozessoren schieben diesen Anteil so weit nach oben, daß es außerhalb des Hörbereiches liegt. Es gibt Geräte, die einen kompletten 32-Bit-DSP nur dazu verwenden, das Dither-Signal zu erzeugen.

Super Bitmapping
Dieses Verfahren ist eine Entwicklung von Sony. Wie es genau funktioniert, weiß nur Sony selbst. Klanglich liegt es irgendwo zwischen Redithering und Noiseshaping. Der Original-SBM-Prozessor kostet ca. 20.000 DM, aber in manchen DAT-Recordern von Sony sind 20-Bit-Wandler mit einer abgespeckten SBM-Variante zu finden.

Und die Moral von der Geschicht'...
Die Erhöhung der Wortbreite eines Digitalsignals bringt Vorteile, und zwar auch dann, wenn das Musiksignal zum Schluß auf der CD mit 16 Bit verewigt wird. Bei mehreren digitalen Bearbeitungsschritten ist es sogar unerläßlich, mit einer höheren Auflösung zu arbeiten, da nur so die 16 Bit des CD-Formates überhaupt genutzt werden können.


· [Zurück] · [Total Recall] · [ths Nation] ·