Qualitätssteigerung bei Digitalaufnahmen
Seit Einzug der Digitaltechnik in unsere Studios haben sich zwei Abtastfrequenzen etabliert: 44,1 kHz (Audio-CD, Profi-DAT) und 48 kHz (Consumer-DAT, aber auch interne Frequenz vieler Digital-Effektgeräte). Nun soll mit 96 kHz alles noch besser werden. Hört man das überhaupt?
Grundlagen
Bei der Digitalisierung wird ein analoges Signal in bestimmten Zeitabständen abgetastet. Zu jedem dieser Zeitpunkte wird der Pegel des Signales gemessen und als Zahlenwert dargestellt. Je häufiger diese Abtastung erfolgt, desto schneller können Änderungen der Amplitude registriert werden - was nichts anderes bedeutet, als daß höhere Frequenzen dargestellt werden können. Die höchste darstellbare Audio-Frequenz ergibt sich nach dem Shannon'schen Abtasttheorem als die Hälfte der Abtastfrequenz. Bei 44,1 kHz könnte das Audiosignal theoretisch bis 22,05 kHz reichen. Sofern höhere Frequenzen als die halbe Sampling-Frequenz (auch Nyquist-Frequenz genannt) im Audiosignal vorkommen, entstehen unangenehme, nichtlineare Verzerrungen, die als Aliasing (von "alias", lat., der andere) bezeichnet werden. Daher ist sicherzustellen, daß vor der A/D-Wandlung tatsächlich keine solchen Frequenzen mehr im Spektrum vorhanden sind. Zu jedem A/D-Wandler gehört daher ein Anti-Aliasing-Filter, das aufgrund seiner endlichen Flankensteilheit aber schon weit vor dem Wert von 22,05 kHz mit der Absenkung beginnt. Bei der Konstruktion solcher Filter ist daher ein Kompromiß zu schließen: Entweder legt man das Filter sehr steilflankig aus, so daß die Absenkung erst oberhalb von 20 kHz beginnt, oder aber man wählt eine flachere Flanke und beginnt schon deutlich unterhalb von 20 kHz mit der Absenkung. Im ersten Fall wird das Filter durch eine hohe Welligkeit im hörbaren Bereich eine Verfälschung erzeugen, im zweiten Fall ergibt sich die Verfäschung durch die Filterflanke selbst.
96 kHz gegen Nyquist
Bei einer Erhöhung der Samplingfrequenz auf 96 kHz steigt die Nyquist-Frequenz auf satte 48 kHz. Dadurch kann die Eckfrequenz des Filters beispielsweise auf 24 kHz eingestellt werden, wodurch einerseits der Audio-Frequenzgang erweitert wird und andererseits eine volle Oktave für die Filterflanke zur Verfügung steht. Hier wird die Problematik der etwas "engen" Auslegung der bisheringen Samplingfrequenzen also deutlich entschärft. Andererseits muß man zugeben, daß heutige Digitalfilter so hervorragend klingen, daß der erweiterte Frequenzbereich nicht der wichtigste Grund für eine Umstellung des Formates ist.
96 kHz und Equalizer
Digitale Equalizer arbeiten mit Algorithmen, die zur Berechnung eines einzelnen Sample-Wertes auch die benachbarten mit einbeziehen. In einem 96-kHz-Signal stehen in einem gleich breiten Zeitfenster aber viel mehr benachbarte Werte zur Verfügung, wodurch der Algorithmus präziser wird. Darüber hinaus ergibt sich durch die Bandbegrenzung zur Nyquist-Frequenz eine Asymmetrie der Glockenkurven parametrischer Equalizer, die besonders in den hohen Bändern störend wirkt. Aus diesem Grund arbeiten schon heute einige Geräte intern mit einer höheren Samplingfrequenz, auch wenn das Signal am Digitalausgang nur mit 44,1 oder 48 kHz ausgegeben wird.
96 kHz und weitere Vorteile
In digitalen Signalketten wird oft mit einem geringen Zusatz von Rauschen, dem sogenannten Dither-Rauschen, gearbeitet. Auch hier haben 96-kHz-Signale die Nase vorn, denn die Rauschleistung verteilt sich auf ein doppelt so breites Band, von dem nur eine Hälfte hörbar ist. Durch geschickte Filterung (Noise Shaping) kann sogar der größte Teil in den unhörbaren Bereich verlagert werden.
96 kHz und der Haas-Effekt
Beim Richtungsempfinden einer Stereo-Aufnahme unterscheiden wir zwischen der Intensitäts-Stereofonie und der Laufzeit-Stereofonie. Erstere beruht auf unterschiedlichen Pegeln eines Signals in beiden Kanälen und wird im Studio mit den Panorama-Reglern des Mischpults erzeugt. Bei natürlichen Stereoaufnahmen, insbesondere bei Nutzung der klassischen Zwei-Mikrofon-Technik, ergibt sich das Richtungsempfinden jedoch aus den Laufzeitunterschieden. Nach dem Gesetz der ersten Wellenfront, auch Haas-Effekt genannt, orten wir ein Signal aus der Richtung, aus der der Schall zuerst unser Gehör erreicht - und zwar auch dann, wenn die Lautstärke an beiden Ohren gleich ist.
Nur wenig aus der Stereomitte verschobene Signale erzeugen Laufzeitunterschiede von nur wenigen Mirosekunden. Der Abstand zweier Samples eines 44,1-kHz-Signales beträgt jedoch eine 44.100stel Sekunde, also ca. 23 Mikrosekunden. Im Gegensatz zu vielen veröffentlichten Ausführungen können aber dennoch kürzere Zeitabstände dargestellt werden, da die Phasenlage eines digitalen Audiosignals wertkontinuierlich vorliegt. Allein die Erhöhung der Samplingfrequenz bringt hier folglich keinen Vorteil.
Fazit
Aus Sicht der Aliasing-Problematik sind wir mit den heute üblichen Abtastfrequenzen bereits gut bedient. Die Erhöhung auf 96 kHz bringt allenfalls leichte Verbesserungen, profitiert allerdings gleichzeitig auch von besseren Equalizeren und anderen Effekten zur Nachbearbeitung. Wenn die Nachbearbeitung mit 96 kHz durchgeführt wird und alle Schritte, die von der hohen Samplingrate profitieren, abgeschlossen sind, spricht allerdings nicht viel gegen die anschließende Konvertierung auf 44,1 kHz. Ob daher 96 kHz auch für Tonträger und Consumer-Abspielgeräte sinnvoll sind, bleibt fraglich. In jedem Fall ist die Erhöhung der Auflösung auf 24 Bit weit wichtiger als die höhere Samplingrate.