OpenAI kann menschliche Stimmen reproduzieren – die Technologie wurde jedoch noch nicht veröffentlicht

Die Sprachsynthesetechnologie hat seit der Einführung der Speak & Spell-Spielzeuge im Jahr 1978 große Fortschritte gemacht. Mithilfe von Deep-Learning-Modellen der künstlichen Intelligenz kann Software nun nicht nur realistisch klingende Klänge erzeugen, sondern auch vorhandene Klänge mithilfe kleiner Audio-Samples überzeugend imitieren. OpenAI hat diese Woche Speech Engine veröffentlicht, ein Text-to-Speech-Modell mit künstlicher Intelligenz, mit dem synthetische Sprache aus aufgezeichneten 15-Sekunden-Audioclips erstellt werden kann. Aber OpenAI ist noch nicht bereit für eine breite Veröffentlichung seiner Technologie, und das Unternehmen plante ursprünglich, Anfang dieses Monats ein Pilotprogramm zu starten, damit sich Entwickler für die Sprach-Engine-API anmelden können. Doch nachdem das Unternehmen mehr über die ethischen Implikationen nachgedacht hatte, beschloss es, seine Ambitionen vorerst zurückzufahren. Das Unternehmen hofft, dass die Vorschau das Potenzial von Sprach-Engines demonstriert und die Notwendigkeit weckt, soziale Widerstandsfähigkeit gegenüber den Herausforderungen aufzubauen, die durch immer überzeugendere generative Modelle entstehen. Insgesamt ist die Technologie zum Klonen von Stimmen nicht besonders neu, aber die Idee, dass OpenAI nach und nach jedem die Nutzung seiner speziellen Sprachtechnologie ermöglicht, ist bemerkenswert. Zu den Vorteilen der Sprachtechnologie gehören nach Angaben des Unternehmens die Bereitstellung von Leseunterstützung durch natürliche Stimmen, die Bereitstellung globaler Reichweite für YouTuber, die Bereitstellung personalisierter Sprachoptionen für nonverbale Personen und die Unterstützung von Patienten bei der Wiedererlangung ihrer Stimme nach einer Operation. Es bedeutet aber auch, dass jeder, der 15 Sekunden der aufgezeichneten Stimme einer Person besitzt, diese effektiv klonen kann, was offensichtliche Auswirkungen auf möglichen Missbrauch hat. Deshalb warnt OpenAI uns alle verantwortungsbewusst vor dieser bereits vorhandenen Technologie und sagt, dass sie die sprachbasierte Authentifizierung von Bankkonten auslaufen lassen und die Öffentlichkeit über das „Potenzial für betrügerische KI-Inhalte und Lösungen wie die Beschleunigung der Technologieentwicklung“ aufklären wollen kann die Herkunft von Audioinhalten nachvollziehen.

$ARS

$AIGX

$FET $SOL $BTC #Ai赛道