Cet article date de plus de deux ans.

Enquête La Caisse des allocations familiales utilise un algorithme pour détecter les allocataires "à risque"

Depuis 2010, la Caisse nationale des allocations familiales (Cnaf) utilise des algorithmes pour noter les allocataires en fonction du risque qu’ils représentent. Une note qui joue ensuite dans les choix des contrôles effectués.

franceinfo - Benoît Collombat, cellule investigation de Radio France

Radio France

Publié le 09/12/2022 06:11 Mis à jour le 09/12/2022 06:13

Temps de lecture : 24min

La caisse nationale des allocations familiales utilise un algorithme pour détecter les allocataires "à risque". (ARNAUD JOURNOIS / MAXPPP)

"On est devenu une mini-PME. On n’est plus là pour aider les gens, mais pour faire du chiffre." Ainsi parle un "technicien conseil" qui travaille depuis plusieurs années au sein de l’une des 101 Caisses des allocations familiales (Caf) en France. "Notre prime d’intéressement est calculée en fonction des objectifs atteints par les caisses locales, explique le représentant CGT dans les instances nationales de la Sécurité sociale, Yves Alexis. Or parmi ces objectifs, il y a les délais de traitement, l’accueil… mais aussi la détection de fraudes."

Et pour détecter ces fraudes, la Cnaf a recours à une méthode au nom très anglais : le "datamining". C’est une technique numérique de statistiques prédictives qui, en croisant différentes données dans différentes administrations, est censée identifier les risques d’erreurs ou de fraude dans un dossier d’allocataire. Elle s’est généralisée au sein de la Cnaf à partir de 2010, avec l’utilisation d’algorithmes. "La Cnaf a été le laboratoire, le bon élève du datamining au sein des administrations françaises", explique le sociologue Vincent Dubois, professeur à l’Institut d’études politiques (IEP) de Strasbourg et auteur de l’ouvrage Contrôler les assistés. Genèses et usages d’un mot d’ordre (Ed. Raisons d’Agir). "Elle a développé une politique d’automatisation du déclenchement des contrôles."

"Le tournant se situe au milieu des années 90, poursuit l’universitaire. Les organismes de protection sociale vont être poussés par le pouvoir politique à renforcer les contrôles." À l’époque, l’État lance en effet une politique volontariste de lutte contre la fraude. "Nous avons décidé d’engager une action résolue contre les fraudes sociales, déclare Nicolas Sarkozy, le 15 novembre 2011, à Bordeaux. C’est la fraude qui mine les fondements même de cette République sociale que les frères d’armes de la Résistance ont voulu bâtir pour la France et qu’ils nous ont légué. Frauder la Sécurité sociale, ce n’est pas simplement abuser du système, profiter de ses largesses, c’est voler chacun et chacune d’entre nous."

Des allocataires notés

Mais l’algorithme ne fait pas que détecter des risques d’erreurs ou de fraude. En mars 2021, après avoir échangé avec la Caf qui lui réclamait injustement un indu (un trop-perçu) de 542 euros, la journaliste indépendante Lucie Inland découvre qu’on lui a attribué un "score de risque". "J’avais une note de 0,4. Je n’étais donc pas trop risquée… Mais un petit peu quand même, explique-t-elle. Je me suis alors rendu compte que ma déclaration d’aide au logement et de prime d’activité passait par la moulinette de l’algorithme de la Caf."

"La Cnaf a créé un profil type de présumé fraudeur avec un certain nombre de caractéristiques, confirme Noémie Levain, juriste à La Quadrature du net. Un score de risque va ensuite être attribué à chaque allocataire. Plus ce score se rapproche de 1 et plus le risque de subir un contrôle est élevé." "C’est devenu la pierre angulaire du déclenchement des contrôles, affirme Vincent Dubois. Cela s’appuie également sur une base de données extrêmement importante qui concerne les allocataires, mais aussi leur famille."

Le passage au numérique a permis à la Caf d’analyser les données de ses allocataires et de leur famille. (BONNAUD GUILLAUME / MAXPPP)

Interrogée sur ce point, la Caf minimise l’utilisation de cette technologie. Selon elle, seuls 6 % de l’ensemble des contrôles seraient issus de l’outil datamining, tout en reconnaissant que 70 % des contrôles effectués en présence de l’allocataire, qui ont entraîné un remboursement d’allocation, ont bien été initiés par lui. En juin 2020, devant la Commission d’enquête relative à la lutte contre les fraudes aux prestations sociales, l’ancien directeur général de la Caf déclarait pour sa part que le datamining était "devenu la première source de détection des dossiers destinés au contrôle".

Un taux de fraude "insignifiant"

"Avant l’utilisation du datamining, le contrôle s’effectuait dans une ambiance d’organisme social, se souvient Yves Alexis, représentant CGT et contrôleur de la Caf du Tarn et Garonne. On faisait une étude globale du dossier, en vérifiant la déclaration, mais en contrôlant aussi que l’intégralité des droits était bien versée. Désormais, c’est un peu l’inverse : le datamining cible les erreurs de saisie des allocataires, alors que ces erreurs sont rarement des fraudes." Selon Vincent Dubois, "le fait qu’un dossier soit fortement ‘scoré’, comme on dit dans l’institution, place les contrôleurs dans la quasi-obligation de trouver quelque chose qui cloche".

La Cour des comptes estime pourtant le montant des fraudes à 309 millions d’euros en 2021, soit un taux de 0,39 % rapporté à l’ensemble des prestations versées. "On met en place un énorme dispositif, alors que ce taux de fraude est insignifiant", regrette Didier Minot, le président du collectif Changer de cap qui prône un changement de la politique de la Caf en la matière. Un chiffre contesté par une estimation de la Caf basée sur un échantillon de 6 000 dossiers. Selon elle, les indus frauduleux se monteraient à 2,8 milliards d’euros. À titre de comparaison, selon la Cour des comptes, la fraude aux cotisations sociales des employeurs est estimée entre 7 et 25 milliards d’euros. Et la fraude fiscale qui échappe aux recettes de l’État est, quant à elle, estimée autour de 80 milliards d’euros.

Les précaires plus à risques

Parmi les critiques qui visent cet algorithme, il y a d’abord le fait qu’il ciblerait plus particulièrement les personnes précaires. "Contrairement à un contrôle aléatoire où chaque personne aurait la même probabilité d’être contrôlée, cet algorithme entraîne un score de risque élevé pour les personnes les plus précaires, parce qu’à leur statut sont associés des facteurs de risque qui sont en fait des facteurs de précarité, affirme un membre de l’association La Quadrature du net. C’est la raison pour laquelle, parmi les personnes contrôlées, on retrouve une surreprésentation de personnes aux minima sociaux. Plus quelqu’un est précaire, plus il est considéré comme 'risqué'."

Chaque mois la CAF confie à un algorithme la tâche de "noter" ses allocataires : les plus mauvais scores gagnent le droit d'être contrôlés. Exigeons l’arrêt de ces pratiques de surveillance généralisée au service de politiques discriminatoires. https://t.co/oiegE9ZS33
— La Quadrature du Net (@laquadrature) October 19, 2022

La multiplication de déclarations de prestations (APL, prime d’activité, allocation adulte handicapé…) augmente aussi le risque d’erreur. "Les déclarations de ressources trimestrielles sont très complexes à remplir correctement", estime Bernadette Nantois qui travaille depuis plus de 20 ans au sein de l’association Apiced qui aide les travailleurs précaires. "Il y a souvent des erreurs de bonne foi, ce n’est pas de la fraude."

"La moindre variation de ressource, le moindre changement dans la situation familiale du ménage va générer de manière quasi-automatique un contrôle, ajoute Bernadette Nantois. Avec, dans la majorité des cas, une suspension préventive des versements dont le ménage ou la famille bénéficiait jusque-là." Pour elle, c’est "une population avec des revenus modestes, qui se retrouve, de fait, ciblée par l’algorithme". Bernadette Nantois cite notamment le cas d’un dossier qu’elle a suivi d’une personne "contrôlée cinq fois en 15 mois, avec à chaque fois une suspension de droits. Il s’agit de quelqu’un qui bénéficiait de l’allocation adulte handicapé (AAH), à laquelle s’ajoutait le salaire au Smic de sa compagne, avec deux enfants à charge, dit-elle. Les contrôles étaient à chaque fois liés aux légères variations de ressources de sa compagne, de l’ordre de 50 ou 90 euros."

"L’algorithme est conçu comme un miroir des situations statistiques sur les risques d’erreur, répond le directeur général de la Cnaf, Nicolas Grivel. Il n’y a rien de très sophistiqué ou de machiavélique : notre seule préoccupation c’est d’identifier les situations qui génèrent le plus d’erreurs et d’indus, afin d’éviter que les personnes ne génèrent des droits non justifiés pendant trop longtemps."

Des situations dramatiques

L’autre point mis en avant par les détracteurs de l’algorithme, c’est le fait que la Caf ne respecterait pas toujours les procédures légales. "En théorie, une décision de trop perçu (d’indu), doit être motivée en droit, explique un avocat au barreau de Lyon spécialiste de ces procédures, Clément Terrasson. La Caf doit vous indiquer quel article de loi elle est en train d’appliquer. On doit vous donner la raison pour laquelle vous êtes censé rembourser cette somme. Or, c’est très rarement le cas. La Caf emploie souvent des formules un peu vagues comme : 'Vos droits ont changé' ou 'Nous avons recalculé vos prestations'."

"Dans le meilleur des cas, la personne reçoit une notification d’indu assez sommaire, constate également Didier Minot du collectif Changer de cap. On a étudié par exemple le cas d’une femme qui a reçu un document dans lequel on lui disait : 'Suite au contrôle de votre dossier, nous avons constaté sur vos relevés bancaires que vos grands-parents vous aident régulièrement depuis octobre 2020. Or ces sommes n’ont pas été déclarées. Par conséquent nous vous inscrivons comme fraudeuse.' C’est très violent. D’autant plus qu’il est indiqué ensuite que la charge de la preuve lui incombe et, en caractères gras, que la loi rend passible d’amende ou d’emprisonnement quiconque se rend coupable de fraude ou de fausse déclaration. Les neuf-dixième des gens sont démunis face à ces documents et n’ont pas les moyens de les contester." Un constat que partage Bernadette Nantois qui a accompagné de nombreux allocataires au sein de l’association Apiced. "Une suspension de prestations durant plusieurs mois génère des situations dramatiques, avec des dettes et des frais bancaires colossaux. Il nous est même arrivé de prêter de l’argent à des personnes qui ne pouvaient plus assurer leurs dépenses quotidiennes."

Dans la région lyonnaise, un homme a vécu ce type de situation. Suite à une mauvaise transmission d’informations entre l’Assurance maladie et la Caf, cette dernière lui a réclamé à tort 1 200 euros de trop-perçus (prime d’activité et RSA). En raison de cet indu de RSA, le département de Haute-Savoie lance un contrôle détaillé de sa situation : des dizaines de documents lui sont demandés, certains plusieurs fois. Le RSA lui est ensuite supprimé, au motif qu’il n’aurait pas transmis certains documents et fait obstacle au contrôle. Il lui faudra deux ans de procédure devant le Tribunal administratif, avant qu’il n’ait gain de cause et ne retrouve finalement ses droits. "Quand on vous suspend le RSA, vous tombez plus bas que terre, témoigne cet homme. Même si vous agitez les bras, on ne vous entend pas. Et vous vous retrouvez avec 1 000 euros de factures impayées d’électricité. Le plus difficile à vivre, c’est de se retrouver aux Restaurants du Cœur et d’aller, entre guillemets, mendier pour pouvoir manger."

#CAF #SEINEETMARNE 1/ Nouvelle situation : droits "suspendus" sans préavis depuis plus de deux mois pour une famille avec enfants avec le papa en accident du travail. En cause, une information manquante sur des ressources de...2020. pic.twitter.com/f17uedLqop
— Collectif Changer De Cap (@ChangerCap) August 2, 2022

"Les Caf ont des prérogatives exorbitantes du droit commun puisqu’elles peuvent récupérer par la force de l’argent, sans jugement préalable, constate l’ancien haut-fonctionnaire Didier Minot. Cela leur impose une responsabilité qui devrait se traduire par un respect des règles de droit : présomption d’innocence, contradictoire, reste à vivre, c’est-à-dire un minimum vital." Ce à quoi le directeur général de la Cnaf, Nicolas Grivel répond : "On ne procède jamais à une suspension pour le plaisir. Il y a toujours des échanges préalables. Les suspensions interviennent lorsqu’il y a des informations qui nous manquent pour s’assurer de la réalité d’une situation d’un allocataire. Notre mission de service public est de verser le juste droit. Certaines situations individuelles sont dramatiques. Mais notre but et notre moteur, c’est d’éviter ça. Sur 13 millions d’allocataires, il y a beaucoup de situations qui se passent sans difficultés."

Parcours du combattant

En cas de contestation, l’allocataire peut saisir une Commission de recours amiable, et deux mois plus tard, la justice (le tribunal administratif ou le pôle social du tribunal judiciaire). "Entre le moment où on conteste l’indu et la réponse du tribunal, la somme litigieuse aura été récupérée par la Caf, assure l’avocat Clément Terrasson. C’est extrêmement problématique puisque ça valide le mode de fonctionnement potentiellement illégal de la Caf. Ça s’apparente à un déni de justice."

"L’une des pratiques fréquentes de la Caf consiste à débloquer les droits de la personne, la veille ou le lendemain de l’audience, explique Bernadette Nantois. Mais cela ne signifie pas pour autant que les droits sont rétablis sur le long terme. Les procédures peuvent durer plusieurs années." "Il y a une inégalité des armes, estime pour sa part Me Terrasson. Très souvent l’administration est crue sur parole, alors que l’allocataire doit tout justifier point par point. Et une fois qu’il est 'labélisé fraudeur', il est très compliqué de faire changer le regard du tribunal."

Des propos que réfute, là encore, le directeur de la Caisse nationale des allocations familiales, Nicolas Grive : "Il n’existe aucune stratégie organisée de déstabilisation des allocataires par des procédures quelconques, nous sommes là pour les aider. Et la plupart du temps, ça se passe bien. Les Caf sont en permanence mobilisées pour accompagner les allocataires dans leurs droits. Des systèmes de médiation existent dans chaque Caf. Parfois, cela peut aller au contentieux. Mais nous agissons évidemment dans le cadre de la loi."

Un algorithme très secret

Une autre interrogation porte sur le modèle de fonctionnement de l’algorithme utilisé par la Cnaf. En septembre 2017, dans un rapport, le Défenseur des droits avait alerté sur "les dangers" de l’utilisation du datamining. Il mettait notamment en garde contre un risque de discrimination, parce qu’une circulaire interne de la Cnaf datée de 2012 recommandait de "cibler les personnes nées hors de l’Union européenne". “Plus qu’un ciblage sur des 'risques présumés', la pratique du datamining contraint à désigner des populations à risque et, ce faisant, conduit à instiller l’idée selon laquelle certaines catégories d’usagers seraient plus enclines à frauder", écrivait alors le Défenseur des droits. Interrogé sur ce point, la Cnaf n’a pas répondu.

De son côté, en 2010, la Commission nationale informatique et libertés (Cnil), a donné son feu vert à l’utilisation du datamining par la Cnaf. Mais depuis 2016, il existe tout de même des obligations légales à respecter pour les administrations. "Si quelqu’un en fait la demande, l’administration doit être capable d’expliquer quel rôle l’algorithme a joué dans la prise de décision qui concerne la personne", rappelle Soizic Pénicaud qui a travaillé sur le sujet au sein de l’État, à Etalab, un département de la Direction interministérielle du numérique. Mais ces obligations seraient assez peu respectées par les administrations. "Soit parce qu’elles manquent de ressources en interne, analyse Soizic Penicaud, soit parce qu’il existe des exceptions à ces obligations, lorsque les algorithmes concernent la sûreté et la sécurité de l’État."

Pour en avoir le cœur net, l’association La Quadrature du net a demandé à la Cnaf de lui fournir le code source de son algorithme de contrôle, autrement dit : la formule utilisée pour aboutir au score de risque attribué aux allocataires. "Ils nous ont envoyé un fichier texte qui ne sert à rien, raconte un membre de l’association. Il y a une formule avec le nombre de variables utilisées pour calculer le score de risque, mais les noms de ces variables ont été masqués. On peut donc lire : 'Variable 1', 'Variable 2', 'Variable 3', etc. Comme si la Cnaf n’assumait pas cette surveillance des plus précaires."

Les responsables de la CAF doivent assumer leur politique discriminatoire et mettre un terme à l'utilisation de cet algorithme. Nous demandons aussi la publication de son code source afin que la lumière soit faite sur ces choix politiques faits en notre nom à toustes.
— La Quadrature du Net (@laquadrature) October 19, 2022

Du côté de la Cnaf, on répond qu’il s’agit simplement de préserver une certaine confidentialité face à la menace d’une fraude organisée qui pourrait, elle, intervenir à grande échelle. "Certaines données pourraient être utilisées par des personnes dont le but est de frauder le système par des méthodes assez sophistiquées (usurpation d’identité, faux documents), explique Nicolas Grivel. Face à cette fraude organisée que nous voulons combattre, il faut avoir un coup d’avance. Elle est minoritaire mais a un impact très fort sur le système social. C’est la raison pour laquelle nous avons créé un service national de lutte contre la fraude à enjeux." Un service qui devrait regrouper trente personnes sur 700 contrôleurs.

Plusieurs chercheurs de l’Institut national de recherche en sciences et technologies du numérique (INRIA) ont également travaillé sur le calcul des aides au logement. "Conformément aux dispositions de la loi République numérique de 2016, l’algorithme de calcul du code source des aides au logement a été publié par la Cnaf en 2018, explique l’un de ses chercheurs, Denis Merigoux. Or, dès les prémices de notre étude, nous nous sommes aperçus que le code source publié avait été écrit dans le langage de programmation Cobol qui semble avoir été produit à l’aide d’un atelier de génie logiciel, ce qui en rend la lecture par un humain quasiment impossible." Le chercheur souligne également que "seules les grandes organisations comme la Cnaf disposent des machines" pouvant lire ce code source.

Moins d’humains, plus d’ordinateurs

Cette contestation de l’utilisation des algorithmes par la Cnaf se double d’une critique plus large portant sur les conséquences de la numérisation et de la dématérialisation des dossiers des allocataires."Les gens n’ont plus d’autre choix que de créer un espace en ligne", constate Bernadette Nantois qui conseille les travailleurs précaires et notamment immigrés. "Même quand on est alphabétisé, on n’est pas forcément à l’aise avec l’outil informatique. Ça touche aussi bien des personnes âgées que des jeunes très à l’aise avec un smartphone mais beaucoup moins quand il s’agit de faire des démarches en ligne sur des sites administratifs." Selon l’Insee, 17 % de la population est touchée par ce qu’on appelle l’illectronisme, la difficulté face à l’outil numérique.

Cette difficulté se conjugue avec le nombre de guichets d’accueil qui se réduisent au sein des Caf. "Le but, c’est d’expédier les gens, raconte une personne chargée de l’accueil et qui tient à rester discrète. On nous explique qu’il faut les éduquer et les renvoyer sur Caf.fr. Dès qu’on a un entretien, le logiciel se déclenche et au bout d’un quart d’heure, le chronomètre commence à clignoter, en rouge." À quoi Bernadette Nantois ajoute : "Derrière ces procédures, il y a une certaine vision de l’allocataire considéré comme un fraudeur en puissance."

Interrogée sur ces différents témoignages, la Cnaf se défend d’être dans un tel état d’esprit. Son directeur général affirme que "la dimension humaine reste essentielle, elle est constitutive de la branche famille de la Sécurité sociale." "Il y a beaucoup de personnes pour qui la dématérialisation a constitué une amélioration considérable, ajoute Nicolas Grivel. Pour d’autres catégories de la population, ce n’est pas l’outil adapté. Nous y prêtons une attention très forte. On essaye au maximum d’être proactifs, d’appeler les gens pour leur rendre un meilleur service, comme durant le Covid."

Le nombre de guichets d’accueil de la Caf réduit d’année en année, en parallèle de la numérisation des services. (XOSE BOUZAS / HANS LUCAS)

Cette numérisation s’accompagne d’importants marchés publics passés avec des entreprises du secteur, mais aussi avec Atos, Cap Gemini ou Thalès. En octobre-novembre 2022, 470 millions d’euros de marchés publics ont ainsi été souscrits par la Cnaf pour différentes prestations de services. "Il y a notamment un contrat de 125 millions d’euros conclu avec Cap Gemini sur quatre ans pour gérer la relation avec les allocataires, souligne Didier Minot. Comme si l’ensemble du dispositif informatique glissait vers une privatisation." Rien de tel n’est envisagé, répond la Cnaf. Nicolas Grivel affirme qu'"il s’agit de se faire appuyer ponctuellement par des prestataires sur une expertise particulière, tout en développant sa compétence interne".

Mais en interne, le malaise semble profond. "Auparavant, lorsqu’on rentrait à la Sécurité sociale, on y restait : ce n’est plus le cas, constate Lise Charlebois, assistante sociale à la Caf du Doubs et membre du syndicat Sud. Depuis une dizaine d’années, on a des ruptures conventionnelles, des démissions. En 2021, dans notre Caf, 19 CDI sont partis, il y a eu six ruptures conventionnelles et une reconversion professionnelle. C’est énorme. La personne qui est partie en rupture conventionnelle m’a dit : 'J’ai besoin de remettre du sens dans mon travail. Parce que ce que je fais n’en a plus.'" Dans ce contexte, le prochain contrat d’objectif et de gestion de la Cnaf pour les cinq ans à venir, doit être renégocié en 2023.

La cellule investigation de Radio France lance sa plateforme d’alerte. Pour nous transmettre une information de manière anonyme et sécurisée, vous pouvez désormais cliquer ici : alerter.radiofrance.fr

: Enquête La Caisse des allocations familiales utilise un algorithme pour détecter les allocataires "à risque"

Des allocataires notés

Un taux de fraude "insignifiant"

Les précaires plus à risques

Des situations dramatiques

Parcours du combattant

Un algorithme très secret

Moins d’humains, plus d’ordinateurs

Enquête La Caisse des allocations familiales utilise un algorithme pour détecter les allocataires "à risque"