Cet article date de plus d'un an.

Podcasts : la traduction des voix par l’IA arrive sur Spotify

Après HeyGen, cette technologie de doublage qui fait parler le présentateur dans plusieurs langues, en synchronisant les mouvements des lèvres, Spotify vient d’annoncer une innovation comparable pour les podcasts.
Article rédigé par Benjamin Vincent
Radio France
Publié Mis à jour
Temps de lecture : 3min
Le projet pilote de traduction vocale automatique par intelligence artificielle de Spotify (CAPTURE D'ECRAN)

Spotify se lance dans la traduction automatique des voix d’un podcast, grâce à l’intelligence artificielle, avec un objectif : le monde entier. Prenons l’un des cinq premiers exemples mis en ligne par le service de streaming suédois. Il s’agit de l’un des podcasts les plus écoutés aux États-Unis, dans la catégorie "Technologie" : le podcast de Lex Fridman, lui-même informaticien et chercheur en intelligence artificielle. Cet Ukrainien d’origine, qui a aujourd’hui la double nationalité américaine et russe, a d’abord travaillé chez Google, et il enseigne aujourd’hui au prestigieux MIT près de Boston.

Même épisode, mêmes voix, plusieurs langues

En version originale, autrement dit en anglais, il parle de sa voix bien connue des amateurs : une voix grave et posée, assez facilement reconnaissable. Jusqu’à présent, c’était la seule version disponible. Mais l’épisode 390 est désormais disponible, pour tous les utilisateurs de Spotify, dans une deuxième version, en espagnol, générée grâce à l’intelligence artificielle et aux dernières technologies vocales d’OpenAI, le créateur de chatGPT.

La prouesse, c’est qu’il ne s’agit pas d’une voix synthétique, robotisée, quelconque, mais de la voix clonée de Lex Fridman, dans une langue qu’il ne maîtrise pas : l’espagnol. En cliquant sur Lecture, on découvre donc le même début d’épisode avec la même voix… Mais en espagnol.

Lex Fridman, sur Instagram, s’est félicité de soudain parler espagnol : "Je suis impatient que l’IA fasse sauter cette barrière de la langue, a-t-il écrit, pour révéler cette humanité que nous avons en commun". Sur Spotify, on peut donc écouter l’intégralité de cet épisode, qui dure près de trois heures. Tout y est : le ton, les silences, le rythme. Pas mal pour une version pilote !

En français et en allemand, incessamment

Et le concurrent d’Apple Podcasts, Deezer et Amazon Music ne compte pas s’arrêter à l’espagnol. Les traductions, cette fois en français et en allemand, arrivent dans les jours et les semaines qui viennent. C’est, en tout cas, ce que promet Spotify à son demi-milliard d’utilisateurs au total, dont 210 millions d’abonnés payants au dernier trimestre. Ils sont plus de 100 millions désormais à écouter des podcasts sur la plate-forme.

Alors, pas de fausse joie : seuls quelques podcasts vont bénéficier de ces versions traduites, en tout cas, dans un premier temps. Et puis, l’autre enjeu, c’est la traduction des podcasts depuis d’autres langues que l’anglais. Imaginez si les podcasts français pouvaient devenir disponibles, avec les voix originales, en anglais, en espagnol ou en chinois. Ils pourraient dépasser les frontières de la francophonie, avec de nouvelles perspectives.

Les enjeux sont importants : la concurrence ne va certainement pas en rester là, notamment Apple Podcasts qui défend difficilement sa place de n°1 après avoir inventé les podcasts, il y a plus de 15 ans.

Commentaires

Connectez-vous à votre compte franceinfo pour participer à la conversation.