OpenAI

OpenAI révèle une IA capable de cloner n’importe quelle voix : Juste un enregistrement de 15 secondes suffit

OpenAI a dévoilé un nouvel outil révolutionnaire capable de recréer la voix de n’importe qui à partir d’un simple enregistrement. Toutefois, consciente des risques associés à un tel dispositif, la start-up prend des précautions avant son déploiement.

Pour quels usages ?

Après ChatGPT pour le texte, Dall-E pour les images et Sora pour la vidéo, OpenAI présente Voice Engine. Cette intelligence artificielle (IA) est capable, “à partir d’un texte et d’un échantillon audio de 15 secondes,” de générer “une parole naturelle qui ressemble beaucoup au locuteur original.” Le modèle peut également parler dans différentes langues avec la voix qu’il imite. La société travaille sur cette technologie depuis 2022, l’utilisant notamment pour générer les voix dans ChatGPT. L’agent conversationnel peut ainsi répondre aux internautes vocalement plutôt que par écrit.

Selon OpenAI, Voice Engine présente de nombreux usages potentiels, tels que l’aide à la lecture, la traduction, ainsi que l’aide aux personnes souffrant de troubles soudains ou dégénératifs de l’élocution. Les entreprises pourraient également l’exploiter pour créer des livres audio ou même créer une station de radio automatisée.

La firme reconnaît également les dangers posés par son outil, c’est pourquoi elle choisit de ne pas le déployer pour le moment. “Nous reconnaissons que la production d’un discours qui ressemble à la voix des gens présente des risques sérieux, qui sont particulièrement importants en cette année électorale,” indique-t-elle dans un billet de blog.

OpenAI ne veut pas se précipiter

De plus en plus d’experts alertent sur la prolifération de deepfakes, que ce soit en vidéo ou en audio. L’année 2024 apparaît comme le premier cycle électoral au cours duquel des désinformations générées par l’IA risquent d’être diffusées à grande échelle. En janvier, par exemple, des milliers d’électeurs de l’État du New Hampshire ont reçu un appel généré par l’IA imitant la voix de Joe Biden, les exhortant à ne pas se rendre aux urnes pour les primaires démocrates.

“C’est un sujet sensible et il est important de bien faire les choses,” déclare Jeff Harris, chef de produit chez OpenAI, à propos de Voice Engine. L’entreprise explore des moyens de limiter les utilisations malveillantes de son outil, par exemple avec un filigrane ou des paramètres empêchant les gens de l’utiliser avec les voix de personnalités politiques ou de célébrités.

“Il est important que les gens du monde entier comprennent où va cette technologie, que nous finissions par la déployer à grande échelle nous-mêmes ou non,” estime la société.

OpenAI n’est pas le seul groupe à travailler sur une telle technologie ; Google ou encore la start-up ElevenLabs, qui a récemment atteint le statut de licorne, sont également dans la course.

Similar Posts