Covid-19 : trois questions sur la surestimation du nombre de cas détectés par Santé publique France
L'agence a annoncé jeudi un changement important dans le système qui permet de comptabiliser les cas de Covid-19 en France, après avoir surévalué le nombre de malades en comptant plusieurs fois certains patients.
L'agence a tenu à rassurer : l'écart constaté ne change pas la dynamique de l'épidémie. Santé publique France (SPF) a mis à jour, jeudi 20 mai, son système d'information, nommé SI-DEP, après avoir surévalué le nombre de malades en comptant plusieurs fois certains patients.
Le logiciel en question lui permet de suivre au quotidien le nombre de cas de Covid-19 recensés, et donc de calculer le taux d'incidence (nombre de cas pour 100 000 habitants) ainsi que le taux de positivité (nombre de cas positifs rapporté au nombre de tests).
Ces indicateurs sont utilisés en France pour évaluer la progression de l'épidémie et influencent le gouvernement dans la mise en place d'un calendrier sanitaire. Franceinfo vous explique ce qui a conduit Santé publique France à cette surestimation.
1Pourquoi Santé publique France a-t-elle surestimé le nombre de cas ?
L'agence s'appuie sur un logiciel nommé SI-DEP (pour "système d'information de dépistage") afin de suivre la progression de l'épidémie de Covid-19 et d'établir les indicateurs que sont les taux d'incidence, de positivité et de dépistage. Le logiciel centralise les tests et leurs résultats.
Pour garantir la protection des données des personnes testées, un algorithme dit de "pseudonymisation" transforme les données (nom, prénom, âge, sexe) du patient en identifiant. Chaque personne testée se voit attribuer un pseudonyme calculé à partir de ses données nominatives. Les données pseudonymisées sont transférées dans la base de données utilisée par Santé publique France pour calculer les indicateurs de l'épidémie.
C'est lors de cette étape de pseudonymisation qu'un problème est apparu. Des personnes ont pu être testées plusieurs fois dans un temps très court et dans plusieurs endroits. Lorsque le nom d'une personne n'était pas saisi exactement de la même façon (accents, majuscules et minuscules…), le système de pseudonymisation pouvait lui attribuer deux pseudonymes différents. Une personne testée deux fois, par exemple pour détecter un variant, devenait alors deux cas, sans qu'il soit possible de l'identifier comme doublon.
Le processus de pseudonymisation a été corrigé avec un algorithme plus souple, et la version corrigée va être appliquée sur les données des trois derniers mois. Cette durée de trois mois correspond à la durée de conservation des données nominatives et, d'autre part, explique Santé publique France, elle recouvre la montée en charge de la détection des variants.
>> Comment prendre rendez-vous pour se faire vacciner contre le Covid-19 ?
2Quelle différence a été constatée ?
En appliquant la nouvelle méthode, Santé publique France annonce que les indicateurs recalculés affichent une baisse de 12% pour le taux d'incidence France entière, une baisse de 8% du taux de positivité France entière, et une baisse de 6% du nombre de cas confirmés.
[⚠️ANNONCE]
— 〽️ Guillaume Saint-Quentin - Météo Covid (/2) (@starjoin) May 20, 2021
Ce soir, les données SIDEP vont être corrigées et présenteront des baisses rétroactives de l'ordre de 12% pour l'incidence, 8% pour la positivité et 6% sur le cumul.
La courbe rouge va remplacer la courbe noire (qui est la courbe actuelle). Explication à la suite ⤵️ pic.twitter.com/RxkylBe662
Au 19 mai, Santé publique France annonçait 5 917 397 cas recensés depuis le début de l'épidémie, avec ces 6% de cas en trop. Le nouveau nombre de cas au 20 mai est de 5 568 551, avec 348 846 doublons qui ont été retranchés.
Le taux d'incidence national était de 148 cas pour 100 000 habitants au 16 mai, il descend à 124 cas pour 100 000 habitants au 17 mai, avec le nouveau calcul.
3Quelles sont les conséquences de cette erreur ?
Cette imprécision sur un indicateur utilisé notamment par le gouvernement pour prendre des décisions et justifier des mesures fait tache. Mais cette révision est à relativiser, car les taux d'incidence et de positivité n'étaient pas les seuls indicateurs utilisés par l'exécutif pour établir l'agenda sanitaire. "Le taux d'incidence n'est lisible qu'avec d'autres indicateurs", souligne SPF dans son communiqué. Les confinements et le couvre-feu étaient également décidés en raison de la situation dans les hôpitaux, notamment.
D'autre part, selon Santé publique France, la comparaison des indicateurs produits avec l'ancienne et avec la nouvelle méthode de pseudonymisation "montre des courbes proches et des tendances similaires sans conséquence sur la dynamique de l'épidémie, son suivi et son interprétation". Cette baisse générale de 6% du taux d'incidence ne change donc pas le scénario de l'épidémie.
Commentaires
Connectez-vous à votre compte franceinfo pour participer à la conversation.