Décryptage : l’analyse des causes de décès

Paru le 13/07/2023

La DREES, le Centre d’épidémiologie sur les causes médicales de décès de l’Inserm (CépiDc-Inserm) et Santé publique France (SPF) ont analysé les causes médicales de décès en 2020. Ces travaux s’appuient sur l’exploitation exhaustive des volets médicaux des certificats de décès effectuée au CépiDc. Ils documentent notamment les effets de l’épidémie de Covid-19 sur la mortalité. Explications d’Élise Coudin, directrice du CépiDc-Inserm, et de François Clanché, directeur de projet à la DREES.


Pourquoi les données sur les causes de décès sont-elles importantes ?

Élise Coudin : Les causes de décès sont des données fondamentales en épidémiologie et en santé publique. L’Organisation mondiale de la santé (OMS) fixe la nomenclature commune (la classification internationale des maladies [CIM version 10]), et les mêmes règles de codage sont suivies par tous les pays pour définir, parmi les causes ou traumatismes mentionnés dans les certificats de décès, la cause initiale menant au décès. Cela permet de dresser des comparaisons internationales et dans le temps des causes de décès. Les chiffres de 2020 produits par le CépiDc ont alimenté la base européenne sur les causes de décès d’Eurostat. On peut ainsi voir que le taux de mortalité standardisé par Covid-19 en France en 2020, première année de la crise sanitaire, se situe dans la moyenne des pays européens.

François Clanché : C’est un indicateur important de suivi de santé publique et de compréhension de la qualité de notre système de santé ainsi que de son évolution dans le temps. En 2020, le Covid-19 a directement causé le décès de 69 000 personnes dans notre pays, ce qui en fait la troisième cause de décès derrière les tumeurs et les maladies cardioneurovasculaires, qui restent les causes de décès les plus fréquentes mais sont en baisse par rapport aux années passées. Dans la foulée, la DREES et le CépiDc ont publié les statistiques provisoires sur les causes de décès en 2018-2019. Ces dernières donnent un premier aperçu des causes de décès à la veille de la crise sanitaire liée au Covid-19, à comparer avec l’année 2020.


Pourquoi les données sur les causes de décès sont-elles particulièrement complexes à traiter ?

François Clanché : Ces données, exhaustives, sont issues des certificats de décès de toutes les personnes résidant et décédées en France en 2020, soit 650000 certificats à analyser ! Il s’agit de textes libres, rédigés par les médecins qui déclarent le motif du décès. Il faut donc les déchiffrer, les comprendre (chacun ayant parfois son vocabulaire), puis les coder selon la CIM 10 de l’OMS. En 2020, seuls 20 % des certificats de décès étaient électroniques, les autres étant rédigés à la main. Ces données sont donc moins simples à exploiter que des données d’enquêtes statistiques ou des données administratives traditionnelles et nécessitent un traitement plus lourd.

Élise Coudin : Une des grandes difficultés provient de la nature du texte dans le certificat, lequel est censé décrire l’enchaînement causal ayant mené au décès, mais ce n’est pas toujours le cas. Les textes sont parfois longs, complexes, hétérogènes. Ils ne suivent pas toujours l’enchaînement causal requis… et il y a plusieurs milliers de postes dans la nomenclature. Pourtant, l’OMS a prévu des règles pour tous les cas. Pour coder l’année 2020, le CépiDc s’est appuyé sur un système de règles automatique (Iris/Muse), qui permet de coder les cas simples, et sur son équipe de codeurs-nosologistes, qui connaissent les règles et la nomenclature de codage sur le bout des doigts pour les cas plus complexes. N’oublions pas qu’en santé publique on doit suivre aussi bien les causes de décès fréquentes que les cas rares !


Pourquoi l’analyse de ces statistiques fait-elle intervenir trois institutions : la DREES, le CépiDc-Inserm et Santé publique France ?

Élise Coudin : On avait besoin de la coordination de ces trois institutions afin de croiser leurs expertises pour cette publication et sa publication jumelle dans le Bulletin épidémiologique hebdomadaire. Le CépiDc recueille les données, puis les code, les produit et les exploite avec une approche d’épidémiologiste et sa connaissance profonde de la base de données. Santé publique France exploite, au fil de l’eau, les certificats de décès en les mettant en regard d’autres sources, avant même qu’ils soient codés par les nosologistes du CépiDc, dans la cadre de sa mission de veille sanitaire. La DREES apporte son expertise statistique et médicale dans l’exploitation de ces données.

François Clanché : Ces données, riches d’enseignements pour les politiques publiques à un niveau très fin, compte tenu de leur exhaustivité, sont ensuite mises à la disposition des chercheurs et des acteurs en matière de santé publique via le SNDS.


Quelles sont les perspectives de ces travaux ?

François Clanché : Le CépiDc et la DREES travaillent pour améliorer la qualité de l’information à la source, pour qu’elle soit plus facile et donc plus rapide à exploiter. La progression des certificats de décès électroniques va dans ce sens : on est à 40 % actuellement, contre 20 % en 2020. La DREES et le CépiDc poursuivent les travaux de codage faisant appel à l’intelligence artificielle, qui viendra compléter le codage automatique sur règles et le codage manuel. Cela permettra, à l’avenir, de mettre plus rapidement ces résultats à disposition. Les données 2021 devraient être publiées fin 2023.

Cette interview est issue du rapport d’activité 2022 de la DREES

Ce rapport revient sur l’aboutissement de travaux importants sur la protection vaccinale, les inégalités sociales de santé, le handicap et l’autonomie, ou le non-recours aux prestations sociales… La DREES y donne également un aperçu de ses travaux sur la situation des professionnels du médico-social et de la santé ou sur les effets des politiques publiques en matière de retraite.


Pour aller plus loin :