Im dritten und letzten Teil geht es ansatzlos weiter mit Rob Watts im zweiten Teil begonnenen Ausführungen über das Noise Shaping des DAVE. Seine Diskussion mit dem Entwickler über Gegenkopplungsarten in der Ausgangsstufe hat Kollege Roland Dietl ad usum Delphini zusammengefasst: Er hat den Text nicht von Anstößigem, sondern lediglich von – zumindest für mich – technisch allzu Kompliziertem befreit.
Rob Watts: Beim HUGO kam ich bei der Verbesserung des Noise Shapings nur zu einem bestimmten Punkt aufgrund der Tatsache, dass da nur ein Vier-Element-Pulse-Array-Wandler zum Einsatz kommt, und weil die Zahl der Gates auf dem FPGA beschränkt ist. Diese Beschränkungen habe ich beim DAVE nicht. Daher habe ich angefangen, die Noise Shaper noch einmal neu zu gestalten und das Thema Tiefe der Abbildung zu untersuchen. Ich startete mit dem Standard vom HUGO, also 200 Dezibel. Ich verbesserte das Noise Shaping um 20 Dezibel, die Bühne wirkte tiefer, ich erhöhte noch einmal im 20 Dezibel, die Tiefe nahm weiter zu. Ich erreichte 60 Dezibel und die Tiefenabbildung wurde noch besser. Über einen Zeitraum von 90 Tagen änderte ich die Struktur des Noise Shapers radikal. Schließlich war es möglich, Signale von minus 350 Dezibel zu reproduzieren. Daher musste ich Testsignale von 48 Bit kreieren, um den Noise Shaper damit zu füttern. Wie sich herausstellte, ja wie sich merkwürdigerweise herausstellte, reagiert das Gehirn unglaublich empfindlich auf extrem kleine Fehler bei der Detailauflösung, Fehler die man für vernachlässigbar halten würde. Aber das Gehirn erkennt sie, und zwar durch die Unfähigkeit, den Instrumente einen exakten Platz auf der Bühne zuweisen zu können. Auch heute finde ich es noch abenteuerlich, wie empfindlich das Gehirn reagiert. Es scheint kein Limit für diese Empfindlichkeit zu geben. Die Genauigkeit der Auflösung muss geradezu perfekt sein, um die Raumtiefe richtig wahrzunehmen.
Schließlich landete ich bei einem Noise Shaping 17. Ordnung. Es gibt 46 Integratoren innerhalb des Noise Shapers. Um dieses Leistungsniveau zu erreichen, musste ich alles bisherige über Bord werfen und eine komplett neue Struktur für Noise Shaper entwickeln. Das hat bisher niemand auf einem so komplexen Level getan. Der komplexeste Noise Shaper, den ich zuvor gesehen hatte, war einer 9. Ordnung für DSD. Ein Noise Shaper 17. Ordnung ist schlicht aberwitzig. Das war eine wirklich spannende Zeit, weil ich jeden Tag eine Verbesserung machte, dann dachte ich darüber nach, wie ich es noch besser machen könnte, dann setze ich es um und probierte es aus. Zu dieser Zeit war ich aber auch etwas beunruhigt, ob die Tatsache, dass der Noise Shaper eine Auflösung von 350 Dezibel hatte, der Grund für die Verbesserung war oder nur ein Symptom für etwas anderes, das vor sich ging. Vielleicht brache die Leistungsfähigkeit des Noise Shapers ja irgendetwas in einem ganz anderen Bereich durcheinander, was zufällig dadurch kompensiert wurde. Vielleicht braucht man gar nicht dieses Niveau an Leistung, und es passierte in Wirklichkeit etwas anderes. Aber ich benutze digitale Noise Shaper im DAVE und vor ein paar Monaten musste ich sie neu gestalten, um die 350 Dezibel zu erreichen. Und ich bekam dieselben Ergebnisse. Man braucht im digitalen Pfad wirklich die 350 Dezibel Auflösung oder 48 Bit Genauigkeit. Das scheint kein Symptom für etwas anderes zu sein. Das Gehirn scheint wirklich so sensibel zu sein. Das treibt einen schon um, dass das Gehirn so empfindlich reagiert. Aber das hat natürlich auch Spaß gemacht.
Aber im Hinterkopf dachte ich noch immer über das Problem mit WTA-Filter nach und dachte auch über die Sache mit HUGO nach, dass ich nicht verstand, warum er die magischen Fähigkeiten hatte, die er nun einmal besaß. Eine Sache, die ich bei all meinen Wandlern gemacht habe, ist, dass die Noise Shaper mit 2048-facher Abtastrate arbeiten. Sie laufen also mit 104 Megahertz und ich filtere 104 Megahertz, so dass das Digital-Signal sehr sauber ist. Da ist so wenig Rauschen vorhanden wie möglich. Ich habe Euch ja die Bilder gezeigt: Auf digitaler Ebene ist der Sinus schön glatt. Das wird bei allen Rauschproblemen so gemacht, auch bei der Modulation des Grundrauschens. Das macht den Klang viel geschmeidiger und dunkler. Ich mache das aus guten Grund, denn sowohl Simulationen als auch Hörtests beweisen, das es wirkt.
Aber dann bemerkte ich, dass ich durch die Verbesserung der Filterung bei 2048, die ich beim HUGO mache, auch das zeitliche Auflösungsvermögen verbesserte. Das brachte mich dazu anzunehmen, dass vielleicht das Zeitverhalten bei 16fs nicht das Problem sei, denn da filtere ich üblicherweise, mit einem WTA-Filter bei 16fs. Ich überlegte, ob ich die Frequenz nicht erhöhen müsste. Beim Hugo gibt in der ersten Stufe ein achtfaches Oversampling und dann geht es einer zweiten Stufe auf 16-faches Oversampling. Die WTA-Filterung ist also 16fs. Dann experimentierte ich mit 16-fachem Oversampling in der ersten Stufe. Ich ersetze also den Acht-mal-eins- durch ein 16-faches einstufiges WTA-Filter und es klang deutlich besser. Es war ein großer Unterschied in der Klangqualität, viel größer als der zwischen Filtern mit 26000 und 164000 Taps. Das brachte mich zu dem Schluss: Das Problem ist, dass ich die Genauigkeit des Zeitverhaltens unterschätzte, die im Wandler beim FIR-Filter nötig ist. 16-faches Oversampling entspricht einer Genauigkeit von einigen Mikrosekunden, aber die Genauigkeit sollte bei viel kleineren Werten liegen. Als ich beim HUGO die neuen Filter verwendete, verbesserte ich die Genauigkeit auf Nanosekunden. Ich hatte also 16-faches Oversampling in der ersten Stufe ausprobiert und dann ging ich in der zweiten Stufe von 16-fachen auf 256-fache WTA-Filterung. Die FIR-Filter laufen nun mit 256-facher Frequenz. Niemand ist bisher auf dieses Level vorgestoßen. Wie ich gesehen habe, ist das höchste, das bisher jemand gemacht hat, 16-fach. Eine 256fs-Filterung benötigt eine beträchtliche Rechenleistung, man braucht eine Menge DSP-Cores, damit es funktioniert. Aber es macht einen großen Unterschied.