"Faire beaucoup plus rapidement, sans compétences techniques" : on vous explique ce qu'est Sora, le générateur de vidéos d'OpenAI

Article rédigé par Camille Laurent
Radio France
Publié
Temps de lecture : 7min
L'interface de Sora présente toutes les vidéos générées par les utilisateurs. (CAPTURE D'ECRAN)
Le géant de l'intelligence artificielle a dévoilé lundi son nouvel outil qui permet de créer des vidéos à partir d'un simple texte, d'une image ou d'une autre vidéo. Mais Sora n'est pas encore disponible en France.

Après ChatGPT, place à Sora. OpenAI a annoncé lundi 9 décembre l'arrivée de son générateur de vidéos(Nouvelle fenêtre) sur les écrans. Ce nouvel outil permet de créer une vidéo très réaliste, à l'aide d'une description de seulement quelques mots donnée à une intelligence artificielle. Il est disponible dans plus de 150 pays, mais pas en Europe qui est dotée d'une importante réglementation en la matière. Sora(Nouvelle fenêtre), qui représente un pas de plus vers la manipulation du réel, est à la fois impressionnant et risqué.

OpenAI, qui a déjà révolutionné les usages de l'intelligence artificielle en lançant ChatGPT il y a deux ans, avait dévoilé une version préliminaire de Sora en février dernier. En cette fin d'année, le géant américain de l'IA égrène ses innovations, comme sa nouvelle version de Sora, sous la forme d'un mini-calendrier de l'avent. "Depuis la présentation de Sora en février, nous avons construit Sora Turbo, une version nettement plus rapide du modèle à mettre entre vos mains", a déclaré lundi Sam Altman, le directeur général d'OpenAI.

Accessible par abonnement...

Sora se veut un outil simple à la portée du grand public. Pour générer une vidéo, l'utilisateur n'a qu'à donner une instruction à l'IA en insérant une phrase ou une image, ce qu'on appelle un "prompt". Il peut ensuite choisir le format (par exemple, 16:9 ou carré), la qualité, la durée (entre 5 et 20 secondes) et le nombre de propositions qu’il souhaite de la part d'IA (jusqu’à 4 vidéos). En à peine quelques minutes, Sora propose ensuite à l'utilisateur la ou les vidéos qu'il a générées.

Il y a aussi le mode "storyboard", qui permet de créer un montage plus complet en enchaînant des séquences. Pour utiliser Sora, il faut posséder un abonnement ChatGPT Plus ou ChatGPT Pro, à 20 ou 200 dollars par mois. Avec ChatGPT Pro, plus de vidéos peuvent être générées, en meilleure qualité et plus longues qu'avec ChatGPT Plus. 

... mais pas partout

Sora est disponible dans 160 pays, mais il est impossible de s'y connecter depuis l'Union européenne, le Royaume-Uni ou encore la Suisse. L'Europe est en effet dotée d'une réglementation stricte en matière de nouvelles technologies et de gestion des données personnelles. Pour s'y implanter, OpenAI doit se conformer au RGPD, le Règlement général sur la protection des données personnelles, et à l'AI Act, la loi qui vise à réguler le secteur de l'IA.

Pour être autorisé, Sora devra notamment donner des gages sur la façon dont sont traitées les informations de ses utilisateurs. En attendant, il est possible de contourner cette impossibilité en utilisant un VPN, un logiciel qui permet de géolocaliser sa connexion dans un autre pays, comme les États-Unis par exemple.

Un outil perfectible

Bien que Sora ne soit pas encore disponible en France, Nicolas Lellouche, journaliste à Numerama(Nouvelle fenêtre), a pu tester le nouvel outil. "Ma première impression est très mitigée. Sur 15 vidéos que j'ai générées, deux sont vraiment belles et indiscernables de la réalité, rapporte-t-il. Les autres ont de très grosses erreurs, des problèmes physiques, des détails incohérents et qui permettent d'identifier en quelques secondes que c'est faux."

"On sent que, même si c'est impressionnant pour générer des vidéos en si peu de temps, on est encore loin d'un réalisme comparable à ce qu'on peut faire avec des photos aujourd'hui."

Nicolas Lellouche, journaliste à Numerama

à franceinfo

Même si son dernier-né ne tient pas encore toutes ses promesses, OpenAI nourrit de grandes ambitions avec Sora et assure qu'il s'améliorera avec le temps. "Cette version est un début, nous savons qu'elle aura des erreurs, elle n'est pas parfaite", a insisté Sam Altman lors de la présentation de l'outil. "Pour l'instant, c'est juste un énième outil de génération de vidéos, on n'est pas du tout sur un outil qui va permettre à des personnes mal intentionnées de générer des vidéos réalistes de désinformation, rétorque Nicolas Lellouche, mais ça viendra. Je n'ai aucun doute sur le fait que ce type d'outil, un jour, sera ultra-perfectionné et pourra tromper les gens.".

Un générateur de vidéos et de dérives ?

Concernant la crainte que Sora permette de produire de fausses informations, ses concepteurs se veulent rassurants. Chaque vidéo Sora comporte une signature électronique dans ses métadonnées, ainsi qu'un petit logo incrusté en bas à droite de l'image permettant d'identifier que le contenu provient d'une IA, qu'on appelle un "watermark". "En réalité, il suffit de recouper une vidéo pour retirer un watermark, tempère Nicolas Lellouche. Et on sait très bien que, sur internet, la plupart des gens ne vont pas vérifier la source d'une vidéo. Donc si une image leur parle et qu'ils ont envie de la croire, ils la diffuseront, avant de regarder dans les métadonnées si elle contient un élément qui dit qu'elle est fausse."

Mais OpenAI a "quand même pris des mesures", souligne le journaliste de Numerama. Sora est doté d'un détecteur de visages, capable d’identifier la présence d’un mineur, d’une personnalité publique ou d’un élément copyrighté. "Par exemple, si je veux mettre une photo de moi et demander à Sora de la transformer en vidéo, je m'engage, en cochant quatre cases, à dire que ce sont bien des images qui m'appartiennent. Et en cas de violation des droits d'auteur, ils le sauront et ils peuvent supprimer mon compte", explique Nicolas Lellouche.

"Ça devient très simple de fabriquer de fausses images"

"On n'a pas attendu l'arrivée de l'IA pour fabriquer de fausses images sur Internet, rappelle Nicolas Lellouche. Ce qui change avec ces outils, c'est que c'est très simple. Sur la vidéo, c'était très compliqué, il fallait généralement des ordinateurs très performants pour modifier un visage, etc. Là, on est potentiellement sur le point de pouvoir faire ça en 10 secondes avec une phrase d'instruction donnée à une IA. Donc là où ça change, c'est qu'on va permettre à des gens mal intentionnés de faire des choses beaucoup plus rapidement, sans compétences techniques."

"À chaque éclosion d'une nouvelle technologie, elle fait du bien mais aussi du mal."

Nicolas Lellouche, journaliste à Numerama

à franceinfo

Bien qu'encore embryonnaire, Sora a été victime de son succès dès son lancement lundi. "La demande est plus élevée que prévu, les inscriptions seront désactivées de temps en temps et les générations de vidéos seront lentes pendant un certain temps", a écrit Sam Altman sur X(Nouvelle fenêtre).

Lancez la conversation

Connectez-vous à votre compte franceinfo pour commenter.