Cet article date de plus de six ans.

Affaire Benalla : cinq questions sur l'étude de l'ONG DisinfoLab, accusée de fichage politique

L'ONG belge DisinfoLab, en cherchant à déterminer s'il y avait eu une ingérence russe pour amplifier la résonance de l'affaire Benalla sur Twitter, a publié les affiliations politiques supposées des personnes ayant tweeté sur le sujet.

franceinfo avec AFP

France Télévisions

Publié le 10/08/2018 17:51 Mis à jour le 10/08/2018 18:25

Temps de lecture : 9min

La Cnil va instruire les plaintes dont elle a été saisie concernant les conditions dans lesquelles une ONG belge a réalisé une étude sur l'impact de l'affaire Benalla sur les réseaux sociaux. (photo d'illustration) (JAAP ARRIENS / NURPHOTO / AFP)

L'affaire Benalla n'a pas seulement occupé le monde politique et médiatique, elle a également agité le web. Une étude réalisée par DisinfoLab, une ONG belge, et menée du 19 juillet au 3 août, a révélé que "plus de 4,5 millions de tweets en français ont été échangés sur le sujet". Un volume qualifié d'"exceptionnel", trois fois supérieur à #BalanceTonPorc.

Mais cette étude sur l'impact de l'affaire Benalla sur les réseaux sociaux va plus loin qu'une simple analyse quantitative. L'ONG est accusée de fichage politique pour avoir classé les comptes Twitter de son étude en "pro-Mélenchon", "pro-Rassemblement national" (RN, ex FN) ou "russophiles".

"Un nombre important" de plaintes ont été déposées par des utilisateurs ainsi fichés auprès de la Commission nationale de l'informatique et des libertés (Cnil). Elle a annoncé jeudi qu'elle allait les instruire. Franceinfo vous explique les ressorts de cette affaire dans l'affaire.

D'où sort cette étude ?

L'organisation à l'origine de cette étude est EU Disinfo Lab, une ONG belge fondée par trois spécialistes des mécanismes de viralisation et de désinformation sur les réseaux sociaux, Nicolas Vanderbiest, Alexandre Alaphilippe et Gary Machado. L'ONG souhaitait se pencher sur le volume considérable de tweets partagés au sujet de l'affaire Benalla, et tester l'hypothèse, émise dans un premier temps, de l'ingérence de comptes "russophiles", dont certains auraient pu être des robots.

En investiguant un peu plus #AffaireBenalla , on remarque une forte part de personnes qui ont tweeté plus de 300 fois en une semaine. Cette part a écrit 1 767 682 tweets (44% des tweets !) Parmi ceux-ci, correspondance de 27 % avec l'écosystème russophile. Dont ce compte. pic.twitter.com/tyBQFg1RdU
— Nicolas Vanderbiest (@Nico_VanderB) July 30, 2018

Cette hypothèse initiale a été prise très au sérieux par des responsables de la majorité, y voyant une bouffée d'air bienvenue en plein tourbillon de l'affaire Benalla. Benjamin Griveaux, porte-parole du gouvernement, a ainsi appelé à ce que "toute la transparence soit faite" sur la provenance de ces messages Twitter, et le groupe Agir (centre-droit) a demandé que la commission d’enquête consacrée à l’affaire Benalla au Sénat se saisisse de "la manipulation attribuée aux comptes russophiles sur Twitter pour déstabiliser l’exécutif français", écrit Le Monde.

Mais cette hypothèse a rapidement été mise en doute par Le Monde, puis DisinfoLab elle-même. Les résultats définitifs de l'étude, publiés mercredi 8 août, nuancent grandement les premières conclusions de l'ONG et balaient le scénario d'une attaque russe.

Que montre-t-elle ?

L'étude révèle que sur les plus de quatre millions de tweets publiés au sujet de l'affaire Benalla sur la période analysée, 2 600 comptes auraient produit 1,8 million de messages à eux seuls. Soit 1% des comptes à l'origine de 47% des messages.

#AffaireBenalla Il y avait bien 1 % des acteurs qui a produit 47 % du contenu en prenant les retweets compris. (3378 individus pour 2163 000 tweets) Le volume reste exceptionnel même sans ces hyper-actifs pic.twitter.com/4IJ2uZmvmc
— Nicolas Vanderbiest (@Nico_VanderB) August 8, 2018

Que peut-on en déduire ? Contrairement aux hypothèses partagées en amont de la publication définitive des résultats, il s'avère difficile d'affirmer que, même avec des taux de retweets impressionnants, certains comptes soient tenus par des robots plutôt que par des humains. Le Monde a ainsi pu contacter des "hyperactifs" identifiés par l'étude et qui se montrent, en chair et en os, fiers du temps passé sur le réseau social.

D'autre part, il n'est pas possible d'en déduire une influence étrangère, notamment de hackers russes. "L'écosystème russophile" mis en avant par l'étude fait référence à des comptes ayant retweeté de nombreuses fois des médias russes, comme Russia Today et Sputnik. Mais, comme l'a déclaré à l'AFP Alexandre Alaphilippe, chercheur à DisinfoLab, "la raison de ce comportement, nous ne l'avons pas".

Ces conclusions sont renforcées par celles d'une autre étude, menée par un spécialiste de la communication politique en ligne, Damien Liccia. "Il n'y pas d'ingérence russe dans l'affaire Benalla. L'influence des [robots] a été infinitésimale", affirme-t-il à l'AFP. Pour Stéphanie Lamy, spécialiste en communication, "l'hyperactivité de Twitter correspond à celle des médias traditionnels pendant l'affaire".

Pourquoi pose-t-elle problème ?

Les premières hypothèses de l'ONG ont occasionné un emballement puis attiré des critiques sur la méthodologie de l'étude. Pour s'en expliquer, DisinfoLab a donc publié, à des fins de transparence, plusieurs données... qui ont elles-mêmes créé une nouvelle polémique. DisinfoLab a publié un premier fichier, listant 55 000 noms de comptes ayant tweeté sur l'affaire Benalla, mais aussi un tableau comportant 3 890 comptes d'utilisateurs qualifiés d'"hyperactifs" en fonction du nombre de rumeurs partagées sur le sujet.

Mais c'est un troisième tableur, désormais inaccessible, qui a suscité de vives réactions. Dans ce fichier, les comptes hyperactifs sont en effet adossés à un numéro, allant de 1 à 4. Cette classification correspond en réalité à une catégorie d'affiliation politique : LR/souverainistes, Rassemblement national, France insoumise, médias/LREM.

Plusieurs utilisateurs ont rapidement apostrophé l'ONG en dénonçant un fichage politique illégal et en annonçant saisir la Cnil. D'autant que le fichier comporte plusieurs erreurs. Ainsi, Serge Slama, professeur de droit sans étiquette, mais abondamment retweeté par les Insoumis lors des auditions parlementaires, a été catégorisé "proche de La France insoumise", comme plusieurs journalistes, à l'instar de Nassira El Moaddem, journaliste et directrice du Bondy Blog. S'est également retrouvé dans cette catégorie le média Contexte.

.@DisinfoEU
Pourquoi suis-je classée France Insoumise dans un de vos fichiers ?
Pourquoi écrivez-vous que j'ai relayé 1 désinformation sur l' #AffaireBenalla?
Je suis journaliste, ne milite pour aucun parti, je suis choquée par vos méthodes.
J'exige vos explications rapidement. pic.twitter.com/iSSMsOHXHH
— Nassira El Moaddem (@NassiraELM) August 9, 2018

Bonjour la @CNIL, je proteste contre ma présence dans le #Fichier de l'officine de désinformation et de #FakeScience "EU DisinfoLab @DisinfoEU" qui a propagé la rumeur d'une manipulation russe de l'affaire Benalla ! Que comptez vous faire pour faire cesser ce type de pratiques? pic.twitter.com/KpDjORkiIE
— Kâplan ⭐️⭐️ (@KaplanBen_Fr) August 9, 2018

Cette liste est-elle légale ?

C'est ce que va devoir trancher la Cnil. Elle a annoncé ce jeudi qu'elle allait instruire les plaintes dont elle a été saisie. L’article 8 de la loi informatique et libertés de 1978 précise qu’il est interdit de traiter des données à caractère personnel qui révèlent les opinions politiques d’une personne physique, comme le souligne Télérama. Cependant, le RGPD (Réglement général sur la protection des données), auquel sont soumis la collecte et le traitement de données à caractère personnel, n'interdit pas l'analyse de sensibilités politiques à partir de données publiques. Mais le travail de l'ONG pose une autre question, selon Télérama : "Peut-on déterminer et ficher l'appartenance politique d'un internaute, sur la base de son activité en ligne ?"

"L’étude publiée repose sur une base légale", s'est défendu DisinfoLab dans un communiqué publié jeudi. "Elle est fondée sur l’exercice du droit à la liberté d’information et du droit du public à l’information, ce qui constitue un intérêt légitime au regard du RGPD et ne nécessite donc pas de recueillir le consentement des personnes concernées." Pour confirmer cette exception à l'obligation d'informer les personnes concernées, la Cnil devra donc entériner cette notion "d'intérêt légitime".

Que répond l'ONG ?

Sur Twitter, DisinfoLab a rejeté les accusations de fichage, expliquant que "ces données avaient été publiées à dessein de vérification méthodologique et afin de limiter la circulation d'un fichier erroné. Notre méthodologie consiste à exporter des données publiques de conversation et à les analyser."

Nous ne réalisons pas de fichage mais nous comprenons que cela puisse être interprété comme tel, et en sommes profondément désolés.
— EU DisinfoLab (@DisinfoEU) August 9, 2018

Vendredi, l'un des coauteurs de l'étude s'est expliqué dans un post publié sur Medium. "Je me suis senti contraint de prouver le bien-fondé de ma méthodologie. Par souci de transparence, nous avons rendu publiques les données de l’étude pour qu[e les critiques] constatent par eux-mêmes notre intégrité", détaille Nicolas Vanderbiest, soulignant que ses analyses ont "toujours reçu un écho très favorable" dans les médias. "Dans mon prisme de doctorant, je ne pouvais soupçonner que le partage de ces données aurait une telle portée", ajoute-t-il, en annonçant "cesser [ses] activités dans le cadre de l’Université catholique de Louvain", où il est assistant universitaire.