L’émergence de l’intelligence artificielle dans la génération de voix a ouvert de nombreuses possibilités, des assistants virtuels aux narrateurs d’audiolivres. Il est donc logique que les entreprises cherchent à exploiter le potentiel de cette technologie. Aujourd’hui nous vous proposons d’essayer un logiciel en version gratuite qui va modifier votre voix en quasi temps réel.
Cette startup révolutionne votre discours en lui donnant une nouvelle voix d’IA “réaliste” – et cela gratuitement
Voicemod, une startup basée à Valence, est l’une de ces entreprises qui a développé un logiciel d’IA et de soundboard permettant de modifier instantanément une voix en une autre. Contrairement à la plupart de ses concurrents, Voicemod affirme transformer les voix en temps réel avec une latence minimale, offrant ainsi aux utilisateurs une expérience de conversation aussi naturelle que dans la vie réelle.
Jaime Bosch, PDG et cofondateur de Voicemod, explique que l’entreprise entraîne son modèle d’IA en utilisant des ensembles de données publics et des acteurs vocaux professionnels, ce qui lui permet de capturer une large gamme d’expressions vocales, de tonalités, de hauteurs et d’émotions. Grâce à l’apprentissage automatique, le modèle apprend à comprendre, analyser et prédire les schémas et subtilités de la parole humaine.
“Lorsqu’un utilisateur parle dans notre logiciel ou notre application, sa voix est instantanément traitée en temps réel“, explique M. Bosch. “Notre modèle d’IA applique ensuite les modèles et les transformations appris à l’entrée, ce qui permet une conversion vocale instantanée.”
Voicemod cible principalement l’industrie du divertissement, notamment les joueurs, les streamers, les créateurs de contenu et les vtubers présents sur des plateformes telles que Discord, Twitch, Zoom et WhatsApp.
Afin de répondre à la demande croissante d’expression personnelle, d’anonymat et de créativité en ligne, la startup lance une nouvelle collection appelée “AI Humans”, en complément des 100 options vocales déjà disponibles dans son portefeuille. Cette nouvelle collection se veut la plus réaliste à ce jour.
Formée à partir d’enregistrements d’acteurs vocaux professionnels, “AI Humans” propose 20 avatars sonores aux personnalités, sexes et âges variés. Parmi ces personnages, on trouve Joe, un homme de 80 ans à la voix “grave et sarcastique”, et Jennifer, une femme de 25 ans au caractère “énergique et amical”. Les utilisateurs peuvent également personnaliser la tonalité de chaque personnage, modifiant ainsi la perception de leur sexe et de leur âge.
La vidéo ci-dessous vous donnera un aperçu de la manière dont ces personnages s’expriment :
“Les voix générées par l’IA offrent des opportunités intéressantes pour les industries cherchant à promouvoir l’exploration créative, l’expression personnelle, la personnalisation et l’inclusion dans les espaces numériques“, déclare M. Bosch.
Quid des risques sur la génération de voix par IA ?
Cependant, bien que la génération de voix d’IA puisse avoir un impact positif, cette technologie présente également des risques. Certains d’entre eux incluent une utilisation abusive, la fraude, l’usurpation d’identité et même le vol de voix, qui affecte particulièrement les acteurs vocaux professionnels.
Selon Bosch, Voicemod travaille activement à atténuer ces risques. Par exemple, l’entreprise développe une technologie de filigrane permettant d’identifier et de suivre les voix générées par l’IA sur les plateformes, tout en mettant en place des mesures de protection de la propriété intellectuelle des acteurs vocaux avec lesquels elle collabore.
M. Bosch est convaincu que l’IA deviendra “un outil” pour ces professionnels. “Ce qui est parfois oublié dans ces discussions sur l’utilisation de l’IA vocale en temps réel, c’est qu’il y a toujours un être humain qui utilise effectivement l’IA“, explique-t-il au média TNW.
Voicemod compte déjà plus de 40 millions de téléchargements. À l’avenir, elle prévoit de lancer une version mobile et de toucher des millions d’utilisateurs actifs chaque mois. L’entreprise explore également des partenariats B2B avec des sociétés de jeux et des plateformes de réalité virtuelle.
Le logiciel est disponible gratuitement sur le site voicemod.net, avec une option payante PRO offrant des fonctionnalités et un contenu supplémentaires.