Actualités, enquêtes à Lyon et dans la région

Comment utilisons-nous les données sur la Covid-19 ?

Voilà six mois environ que nous utilisons sur Rue89Lyon les données publiques des indicateurs de l’épidémie de Covid-19. Mais nous n’avions pas encore pris le temps d’en parler avec vous. Réparons cette absence.

Data-visualisation

Cet article est en accès libre. Pour soutenir Rue89Lyon, abonnez-vous.

Indicateurs Covid-19 Savoie

Pourquoi utiliser et représenter ces donnés ?

Nous avons utilisé les données publiques des indicateurs de suivi épidémique pour la première fois en juillet 2020. A ce moment-là, l’idée était de faire un point d’étape sans idée encore sur la suite à lui donner. La fréquence, devenue rapidement hebdomadaire, s’est ainsi faite chemin faisant, fruit d’un double constat.

D’une part l’audience de ces contenus, bien que fluctuante, nous a semblé témoigner d’un intérêt du lectorat ; d’autre part l’utilisation de ces données nous est apparu intéressante pour illustrer et questionner les mesures sanitaires prises par les différentes autorités.

Aujourd’hui, ces règles sont plutôt installées et malheureusement « durables ». Comme le port du masque dans l’espace public, quasi généralisé, ou encore les mesures de couvre-feu.

À l’époque pourtant, à la fin de l’été 2020, elles étaient encore relativement différenciées et fluctuantes. Rappelez-vous, les obligations du port du masque tombaient au goutte-à-goutte dans les communes du Rhône.

Chaque vendredi, on attendait le communiqué du préfet annonçant les zones concernées.

Des décisions basées sur certains de ces indicateurs. Des données que nous n’avions d’ailleurs pas encore à disposition à ce moment-là (sur cette question nous avons fait déjà fait un premier retour réflexif ici).

Quelles données utilisons-nous ?

Nous utilisons, comme beaucoup, les données mises à disposition en open data. Elles émanent de l’organisme de veille sanitaire Santé Publique France et du Ministère de la santé. Nous avons concentré nos efforts sur celles concernant :

  • le dépistage (nombre de tests)
  • le taux d’incidence
  • le taux de positivité
  • les indicateurs hospitaliers : hospitalisations, réanimation, retour à domicile et décès
  • taux de tension sur les services de réanimation

Pourquoi ne pas utiliser toutes les données disponibles ?

Nous avons choisi de nous concentrer sur certaines données qui nous apparaissaient essentielles.

Pour des raisons pratiques d’une part. Les relevés des données, engendrant de nombreuses manipulations manuelles (nous le faisons pour les 12 départements de la région Auvergne-Rhône-Alpes), restent pour nous (avec nos limites humaines et techniques) des opérations relativement lourdes et chronophages.

Pour une raison éditoriale d’autre part. Nous n’avons pas ambitionné de présenter le suivi de l’ensemble des indicateurs de l’épidémie dans l’ensemble des départements de la région.

De nombreux médias, nationaux notamment, les producteurs de données eux-mêmes ou d’autres initiatives (comme CovidTracker) assurent largement ce travail.

Nous nous sommes concentrés sur celles qui nous apparaissaient essentielles. Et surtout sur celles dictant directement les mesures sanitaires impactant le grand public.

C’est pourquoi nous nous concentrons essentiellement sur les données hospitalières et les taux d’incidence et de positivité. « L’encombrement » des hôpitaux et des services de réanimation dictant en grande partie les restrictions à venir.

Pourquoi utiliser des données forcément limitées ?

Nous n’ignorons pas les limites de certaines données. Tant dans leur lecture que dans leur nature. Sur les tests de dépistage notamment. Jusqu’au mois de décembre par exemple, les tests antigéniques n’étaient pas comptabilisés. Ils le sont depuis mais sont contestés, accusés notamment de produire des faux positifs.

Concernant les statistiques hospitalières, les remontées des données en temps réel sont compliquées pour les hôpitaux. Créant ainsi des « lits fantômes » comme l’évoquait Le Canard Enchaîné dans son édition du 23 décembre 2020.

Parfois, les données des hôpitaux ont abouti à des modifications a posteriori. Un nombre de décès de patients atteints du Covid ou de retours à domicile revus à la baisse d’un jour à l’autre. Comme ici en Ardèche par exemple :

Ces données publiques, même imparfaites, demeurent les seules à disposition pour tenter de représenter l’évolution de l’épidémie. Nous les représentons de manière à ce qu’elles aient du sens malgré tout (utilisations de chiffres sur une semaine glissante plutôt que quotidienne par exemple).

Comment nous essayons de proposer une lecture de ces données ?

Nous avons avancé pas à pas dans la manipulation en essayant d’améliorer leur représentation et leur lecture, en corrigeant nos éventuelles erreurs. Nous étions, comme beaucoup d’entre vous certainement, assez étrangers aux notions de taux d’incidence ou de taux de reproduction effectif d’un virus.

Nous avons fait un premier travail simple : lire et écouter les spécialistes (virologues, épidémiologistes) nombreux à s’exprimer sur le sujet, pour comprendre la signification et la lecture des indicateurs proposés.

Nous avons ainsi très rapidement proposé une lecture du taux d’incidence au regard du niveau de dépistage. On sait le premier très sensible au second.

Par ailleurs, nous avons très vite décidé d’adopter un rythme hebdomadaire.

D’une part parce que nous n’avons pas les moyens de le faire quotidiennement. D’autre part, nous avons rapidement compris qu’un décompte quotidien des chiffres n’avait pas vraiment de sens ni n’autorisait une quelconque lecture de l’évolution de l’épidémie.

Des représentations graphiques pas toujours pertinentes au départ

Au départ, nous avons proposé des représentations quotidiennes de certains indicateurs (comme le taux d’incidence par exemple. Elles n’avaient pas grand sens. Nous avons toutefois toujours apporter une lecture hebdomadaire à d’éventuelles évolutions.

Concernant la représentation graphique des données, nous avons rapidement corrigé ces erreurs de départ pour privilégier des chiffres hebdomadaire par exemple. Ou, quand les données le permettent, des données sur une semaine glissante (les données quotidiennes représentent l’évolution ou la moyenne sur les 7 jours précédents).

Un retard (presque) volontaire et une prudence dans l’analyse

Nous proposions ainsi auparavant des chiffres forcément « en retard ». Les jeux de données de certains indicateurs ont toujours quelques jours « de retard » par rapport à la date de leur publication. Un retard statistique dû au temps nécessaire de remontée des données et de leur consolidation.

Ce recul impondérable combiné à celui de notre rythme nous conduisait donc à présenter des chiffres avec parfois une semaine de décalage par rapport au jour de la publication.

Cela ne nous est pas forcément apparu comme un souci majeur. Par exemple, on sait que si l’épidémie circule davantage, elle se traduira éventuellement par une augmentation des hospitalisations ou des réanimations avec un certain décalage dans le temps. Désormais certains des indicateurs présentent donc une meilleure « fraîcheur » des chiffres.

Nous avons toujours tenté de rester prudents. Les évolutions ne se lisent pas forcément à la forme d’une courbe. Le rythme hebdomadaire, s’il est certainement plus pertinent qu’une lecture quotidienne, reste peut-être encore trop rapide pour certains indicateurs.

Pour plus de souplesse mais aussi plus de pertinence dans l’analyse, nous ferons peut-être évoluer le rythme de nos points sur l’évolution des indicateurs. 

Un traitement qui évolue au fil du temps et de nos réflexions

Tout ceci est pour notre petite rédaction un travail qui se fait au fil de l’eau, de nos réflexions ou parfois des interpellations. Un exemple : le  nombre de décès.

Comme le rappelait récemment le démographe Hervé Le Bras, le virus entraîne un niveau de mortalité plus faible que la crainte qu’il génère. D’où l’importance, nous semble-t-il, d’insister sur les statistiques hospitalières et le niveau de tension dans les établissements. Car, sans manquer de respect aux morts, c’est bien lui qui importe dans les mesures sanitaires touchant le grand public.

À l’inverse les restrictions sanitaires et le degré d’inquiétude sont jugés totalement disproportionnés par d’autres au regard de ce même « faible » le niveau de létalité de la maladie.

Nous l’avons encore constaté lors d’un récent point hebdomadaire où nous une faisions une incise sur le « rythme » actuel de la mortalité à l’hôpital dans la région. Chose plutôt inhabituelle puisque nous relevons très rarement dans ces points hebdomadaires le niveau de mortalité.

Mais il nous a été renvoyé en commentaire sur Facebook que « la maladie ne tuait que 0,0000XXX% des personnes atteintes ». Ou, plus intéressant, que « la courbe verte des des retours à domicile augmentait aussi ». En somme arrêtez de ne regarder que les morts.

Cette remarque nous questionne car c’est justement ce que nous ne voulons pas faire. Peut-être que représenter sur un même graphique un cumul des décès et des retours à domicile (guérisons) n’est finalement pas si judicieux. Car, pour le dire autrement, si la courbe rouge des décès cumulés ne bougeait plus (plus aucun décès à l’hôpital) mais que celles des retours à domicile, des hospitalisations et des réanimations continuaient leur évolution, la pression sur les hôpitaux changerait finalement assez peu. Et les mesures sanitaires également.

Au fil du temps, notre traitement de ces données n’a peut-être pas été très clair de notre part. Dans les premiers temps, nous ne représentations pas les données des retours à domicile. Non pas que nous voulions cacher qu’il y avait davantage de guérisons que de décès (parmi les personnes admises à l’hôpital) mais nous voulions plutôt montrer l’évolution des autres indicateurs.

Nous avons, au fil du temps, incorporé ces statistiques sur les retours à domicile, pour une vision plus complète des statistiques hospitalières. Les retours à domicile, donnée plutôt positive, nous les avons représentés en vert en opposition au rouge des décès.

Représentons-nous bien les données que nous vous voulons souligner ?

En ne voulant donc pas focaliser l’attention sur la mortalité mais sur les niveaux de tension sur les hôpitaux, le travail a donc pu finalement être contreproductif.

L’autre difficulté réside dans le fait cette question de la mortalité ne doit pas être minimisée pour autant. Sous prétexte que la virus et la maladie tuent une faible part des personnes contaminées. Et quasi essentiellement des personnes de plus de 80 ans.

Voilà pourquoi nous avons aussi choisi d’analyser l’excédent de mortalité dans notre région. Mais sur un temps long. Nous avons ainsi proposé des représentations et études de la surmortalité enregistrée en 2020 comparativement aux 10 dernières années dans le Rhône, l’Isère, la Loire, la Savoie et la Haute-Savoie.

Vous avez une remarque ? Une critique ? Des idées à apporter ? N’hésitez pas, les commentaires sont là pour ça.


#covid-19

Activez les notifications pour être alerté des nouveaux articles publiés en lien avec ce sujet.

Voir tous les articles

Autres mots-clés :

Plus d'options