OpenAI stellte seine neue Technologie vor, die Audio aus Aufnahmen klonen kann

AA

OpenAI, das mit der Einführung von ChatGPT sofort weltweit bekannt wurde, entwickelt weiterhin neue Technologien.

Das Unternehmen stellte seine neue „Voice Engine“-Technologie vor, mit der Ton aus einer 15-Sekunden-Aufnahme geklont werden kann.

In der Erklärung wurde mitgeteilt, dass die „Voice Engine“ eine Sprache erzeugen kann, die der Stimme des Sprechers sehr ähnlich ist, indem sie nur geschriebenen Text und eine einzige 15-sekündige Sprachprobe verwendet.

In der Stellungnahme hieß es, die betreffende Technologie sei im Jahr 2022 entwickelt worden und man habe aufgrund des „Missbrauchspotenzials“ bei einer breiteren Veröffentlichung vorsichtig und bewusst vorgegangen.

Es wurden einige Sicherheitsmaßnahmen ergriffen

Bezüglich Sicherheitsbedenken wurde bekannt gegeben, dass es den Nutzerpartnern in der Testphase der Voice Engine untersagt ist, die Identität von Einzelpersonen oder Organisationen zu verwenden, dass die Anfrage des ursprünglichen Sprechers erforderlich ist und dass es obligatorisch ist, das Publikum klar über die Stimmen zu informieren werden durch künstliche Intelligenz erzeugt.

Kann auch übersetzen

In der Erklärung wurde auch die Information geteilt, dass Voice Engine übersetzen kann, während die Stimme des ursprünglichen Sprechers erhalten bleibt.

Es wurde betont, dass Inhaltsproduzenten wie Videos und Podcasts von dieser Funktion profitieren und die Welt „mit ihrer eigenen Stimme“ erreichen können, während gleichzeitig der „Akzent“ des brandneuen Sprechers in der übersetzten Stimme erhalten bleibt.

Ensonhaber

SpracheStimme
Comments (0)
Add Comment