Die neue Sprachsteuerung in ChatGPT

OpenAI erweitert stetig die Fähigkeiten von ChatGPT. Ursprünglich auf Texteingaben beschränkt, ermöglicht das Tool jetzt auch Spracheingaben mittels ChatGPT Voice. Nutzer können ihre Anfragen nun aussprechen, und die Antworten werden ihnen vorgelesen, anstatt sie selbst vom Bildschirm ablesen zu müssen.

Die Sprachausgabefunktion von ChatGPT ähnelt der von Alexa und Siri. Nutzer geben Kommandos per Sprache ein, die dann von der künstlichen Intelligenz verarbeitet werden. Im Unterschied zu den Angeboten von Apple, Amazon und anderen, zeichnen sich die Antworten von ChatGPT durch höhere Qualität und Ausführlichkeit aus. Diese Funktion ist in den ChatGPT-Apps für Android und iOS verfügbar und muss zuerst in den „Einstellungen“ aktiviert werden. Es ist wichtig, die neueste Version der ChatGPT-App zu verwenden. Sobald das Feature aktiviert ist, kann man folgendermaßen mit ChatGPT sprechen:

  • Sobald man Zugang zur Sprachfunktion hat, findet man in der Übersicht der Chat-Verläufe ein Kopfhörersymbol.
  • Ein Klick darauf führt zu einer kurzen Ladeanimation.
  • Erscheint ein Kreis, kann die Spracheingabe durch Drücken aktiviert werden.
  • Kleinere Kreise signalisieren, dass ChatGPT zuhört, woraufhin man seinen Prompt einsprechen kann.
  • Eine animierte Sprechblase deutet die Verarbeitung des Befehls an. Danach liest ChatGPT die Antwort vor.
  • Durch Antippen der entsprechenden Option kann die Antwort auch in Textform angezeigt werden, wie man es gewohnt ist.

 

Die ChatGPT-Sprachfunktion basiert auf einer umfangreichen Sammlung von Tonaufnahmen, die von professionellen Synchronsprechern erstellt wurden. Mit dieser vielfältigen Beispielbibliothek hat OpenAI ein Modell entwickelt, das Wörter und Sprachnuancen auf beeindruckend realistische Weise generiert. Besonders hervorzuheben ist die schnelle Reaktionszeit bei Antworten und die Fähigkeit, nahezu jede Anfrage im passenden Kontext zu beantworten. Dies stellt einen deutlichen Fortschritt gegenüber Siri und Alexa dar.

Es bleibt abzuwarten, wie Unternehmen wie Amazon, Apple und Google auf die fortschrittliche künstliche Intelligenz reagieren, die an HAL aus dem Film “2001: A Space Odyssey” erinnert. Jeder, der sich auch nur oberflächlich mit Künstlicher Intelligenz beschäftigt, wird erkennen, dass in diesem Kontext jede Person eine erhebliche Herausforderung für den Datenschutz darstellt.

Wie weit werden solche Technologien wohl in den nächsten 12 Monaten fortgeschritten sein?