Vocoder – Talkbox – Autotune: Die Verfremdung der Stimme in der Popmusik
Seit etwa 80 Jahren entwickeln sich interessante technische Möglichkeiten, um Stimmen live oder im Studio zu verfremden. Nach wie vor sind diese Techniken in der Popproduktion relevant. In diesem Artikel werden drei interessante Verfahren der Stimmverfremdung vorgestellt.
Inhalt
Vocoder
Der Vocoder
Entstehung
Der Erfinder Homer W. Dudley forschte seit den 30ern für die US-Firma „Bell Labs“ an Möglichkeiten, die Stimme für Ferngespräche zu komprimieren, um damit mehr Gespräche gleichzeitig durch die transatlantischen Kabel transportieren zu können. Er entdeckte, dass die Stimme durch eine kontinuierliche Schwingung der Stimmbänder entsteht, die durch den Vokaltrakt mit Obertönen angereichert wird oder gefiltert (Ah, Eh, Ich, Oh, Uh), und durch Schließlaute unterbrochen ist. Er brach das Frequenzspektrum der Stimme auf 10 charakteristische Obertöne herunter, die zusammen mit der Grundfrequenz Stimme artifiziell nachbilden ließen.
Quelle: Youtube
Der Voder stellte einen Prototyp zur Erzeugung von Lauten, die nach Stimme klangen. Durch manuelles Einstellen des Obertonspektrums per Knopfdruck, sowie steuern der Grundfrequenz via Fußpedal konnte so Sprache maschinell erzeugt werden.
Um die Stimme beim Sprechen live zu analysieren und herunterzubrechen, erfand Dudley den Vocoder, der mithilfe von zehn in Reihe geschaltener Band-Pass-Filter die Intensität der klingenden Obertöne bei Konsonanten- und Vokalbildung messen und auf die zehn charakteristischen Frequenzen aufteilen konnte.

Homer Dudley (October 1940). »The Carrier Nature of Speech«. Bell System Technical Journal, XIX(4);495-515. -- Fig.8
Nachbearbeitet von Clusternote, CC BY-SA 3.0 (Deeplink)
- Ein Low Pass Filter analysiert den Grundton
- Mehrere Band Pass Filter ermitteln die Intensität der jeweiligen Obertöne
- Je mehr Band- Pass- Filter, desto genauer kann die Stimme analysiert werden

Aus: Lecture 4: Sinusoidal Modeling and the Phase Vocoder
Copyright 2020-06-27 by Julius O. Smith III (Deeplink)
Mit dieser Technik ließen sich Audiosignale auch manipulieren und verschlüsseln. Vocoder wurden deshalb zunächst vor allem vom US-Militär im zweiten Weltkrieg eingesetzt.
Vocoder in der Musik
Ab 1970 fanden sich Vocoder in der Musikwelt wieder und wurden kommerziell als Stimmeffekt eingesetzt. Funktionsweise: Das Stimmspektrum wird durch den Vocoder analysiert, die Grundschwingung der Stimme wird durch den gespielten Ton an der Klaviatur eines Synthesizers ersetzt. Dadurch ist auch „polyphones Singen“ möglich, da sich die ursprüngliche Tonhöre durch mehrere gespielte Töne ersetzen ließen.
Prominentes Beispiel für einen solchen Synthesizer ist der microKORG der Firma KORG:

Produktfoto durch Thomann (Deeplink).
Quelle: Youtube
Talkbox
Talkbox
Die Talkbox macht sich ebenfalls den Mundraum als Klangfilter zunutze, um Töne eines Eingangssignals zu manipulieren. Pete Drake war 1960 der Erste, der das Tonsignal seiner Gitarre durch einen Schlauch in seinen Mund leitete, dort den Ton veränderte und mit einem Gesangsmikrofon vor seinem Mund wieder abnahm.
Pete Drake on the Talkbox | Quelle: Youtube
Im Grunde eignet sich jedoch jedes Instrument für den Einsatz mit Talkbox, vorausgesetzt natürlich, es ist elektronisch abgenommen und verstärkt. Die folgende Darstellung zeigt die Funktionsweise der Talkbox. Diese wird zwischen Verstärker und Lautsprecher zwischengeschaltet. Während ein unmanipuliertes Signal zum Lautsprecher weitergeleitet wird, wird ein Teil des Signals durch den Schlauch in den Mund geleitet und dort mit Silben versehen oder anderweitig manipuliert. Der veränderte Klang wird an der Mundöffnung mit einem Gesangsmikrofon abgenommen.

Abbildung von Elliott Sound Products ESP (Deeplink).
Autotune
Antares Autotune (›Cher- Effekt‹)
Aufgenommene Stimmen nachträglich am Computer zu korrigieren war für die großen amerikanischen Studios der 90er ein Traum, der kaum greifbar war. In der analogen Aufnahmetechnik war Tonkorrektur zwar möglich, aber extrem aufwändig und teuer. Erst als Computer langsam leistungsfähiger wurden und die ersten DAWs (Digital Audio Workstation) eingeführt wurden, entwickelte sich eine Fülle an neuen Bearbeitungsmöglichkeiten in Form von Plugins, also digitalen Tonbearbeitungstools.
Geschichte
Erfinder des bis heute renomiertesten Autotune Plugins „Antares“ ist Andy Hildebrand, in seiner Jugend Flötenvirtuose, später Ingenieur bei dem Energiekonzern Exxon. Nach vielen Anläufen, auf dem Musikmarkt Fuß zu fassen, konnte er mit der Entwicklung eines Tools, das automatisch schlecht intonierte Tonhöhen korrigiert, eine wichtige Nische der modernen Musikproduktion auffüllen.
Funktionsweise
Autotune analysiert die Grundfrequenz des (einstimmigen) Audiosignals in Echtzeit und korrigiert diese gegebenenfalls auf den nächstgelegenen Skalaton oder Ton der Chromatik. Je intensiver die Tonanpassung eingestellt ist, desto offensichtlicher lässt sie sich wahrnehmen.
Sehr schnelle und intensive Tonhöhenkontrolle wurde schnell zum Stilmittel und als „Cher-Effekt“ bekannt. Da Autotune automatisch Vibrati glättet, lässt sich mit dem Plugin künstlich erzeugtes Vibrato im Nachhinein hinzufügen. Ebenfalls gibt es eine "Humanize" Funktion, die Fehler zu der gewählten Rate zulässt oder bewusst erzeugt, um den Effekt zu verschleiern.

Produktfoto durch abmischenlernen.de (Deeplink).
›Cher-Effekt‹
Die Produzenten von Cher nutzten schon 1998, also ein Jahr nach Veröffentlichung von Antares Autotune den Effekt, um für Chers Hit „Believe“ einen einzigartigen Stimmklang zu produzieren. Als sich viele Menschen zu Recht fragten, welches neue Tool die Stimme derart perfekt korrigiert, stritten die Produzenten ab, ein Programm zu Tonhöhenkontrolle benutzt zu haben. Sie behaupteten stattdessen, es sei ein Vocoder gewesen.
Cher – Believe, 1998 | Quelle: Youtube
Als der Cher-Effekt dann Mitte der 2000er Jahre von immer mehr Künstlern wie beispielsweise T-Pain als Stilmittel verwendet wurde, wurde der Effekt immer umstrittener. Es gab eine starke Gegenbewegung von KünstlerInnen. Jay Z brachte seine Ablehnung gegen das Stilmittel sogar in einem Song zum Ausdruck, mit dem griffigen Namen D.O.A. (›Death of Autotune‹).
Heute gibt es eine Vielzahl an Plugins, die Audiomaterial analysieren und bearbeiten können. Dabei unterscheidet man Programme wie Antares Autotune, die in Echtzeit Tonkontrolle betreiben, von Plugins zur nachträglichen Tonveränderung.
Für nachträgliche Tonhöhenveränderung ist Melodyne von Ceremony Marktfüher. Aber auch Zynaptic Pitchmap, Waves Tune und GVST Gsnap (Freeware) funktionieren ähnlich. Melodyne und Pitchmap lassen sogar die Bearbeitung von polyphonen Audios zu. Damit könnte man beispielsweise ein Vokalquartett im Nachhinein stimmen. Die Tabelle erleichtert den Vergleich der Software-Produkte:
Abbildung. | ||||
---|---|---|---|---|
Name | Waves Tune | Antares Auto‑Tune Pro | zynaptiq PITCHMAP | Celemony Melodyne editor |
In Echtzeit / Import | nein / ja | ja / ja | ja / nein | nein / ja |
Polyphone Bearbeitung | nein | nein | ja | ja |
Möglichkeiten | Kontrolle des natürlichen Vibratos MIDI-Tonhöheneingabe | Kontrolle des natürlichen Vibratos Auto-Key Microtuning | Separate Bearbeitung/Bewahrung der Transienten synthetische & Vocoder-artige Klänge möglich MIDI-Tonhöheneingabe | Modus für Perkussives, Quantisierung (inkl. Shuffle) Time Stretching mit Ausnahme der Transienten Formanten einzelner Noten bearbeiten Audio-to-MIDI |
Für den Bühnenbetrieb sind zur Tonhöhenkontrolle in Echtzeit auch Standalone Digital Vocal Effects sehr beliebt, zum Beispiel der Boss VE-500 Vocal Performer. Es muss lediglich ein Mikrofon angesteckt werden, alle Parameter können manuell am Gerät eingestellt werden.

Produktphoto der Firma Boss (Deeplink)
Diese drei vorgestellten Techniken sind nach wie vor in der Popmusik anzutreffen. Oft ersetzen digitale Prozessoren allerdings die analogen Geräte und emulieren die Sounds eines Vocoders oder einer Talkbox.