L’enquête Modes de garde et d’accueil des jeunes enfants (MDG) a été réalisée par la Drees en 2021. Elle porte sur les ménages ayant au moins un enfant de moins de 6 ans résidant en France métropolitaine et comporte une extension à La Réunion auprès des ménages avec au moins un enfant de moins de 3 ans. Cette enquête dresse, tous les 6-7 ans environ, un panorama complet des solutions de garde et d’accueil adoptées par les parents pour leurs jeunes enfants, compte tenu de leurs contraintes professionnelles. La mesure du reste à charge des familles selon le mode d’accueil est également l’un des objectifs de l’enquête. Aussi, les revenus des familles doivent-ils être mesurés de manière la plus précise possible.
Les ressources des familles sont évaluées grâce à un appariement avec les sources fiscales et sociales dont dispose l’Insee. L’enrichissement avec les données fiscales est de très bonne qualité : sur les 8 787 ménages de l’enquête, 8 348 ménages, soit 95 %, ont été complètement retrouvés dans les déclarations de revenus et d’imposition. Par ailleurs, 8 538 individus sur 16 373 (soit 52 %) ont été retrouvés dans les fichiers sociaux comme percevant des prestations d’au moins une des caisses disponibles (CNAF et CCMSA).
Ce Drees Méthodes présente les travaux d’imputations réalisés sur les données appariées et enrichies de l’enquête Modes de garde 2021.
Afin de disposer des revenus pour l’ensemble des parents de l’enquête, il est nécessaire d’imputer des revenus aux répondants et/ou à leurs conjoints qui sont actifs occupés ou au chômage et qui n’ont pas été retrouvés à l’issue de l’enrichissement (pour eux, des salaires ou des allocations chômage sont attendus). La démarche consiste en une imputation par « Random Forest » ou forêts aléatoires (méthode plus performante que le hot deck et les k plus proches voisins). Une fois les imputations réalisées, les distributions des revenus (l’ensemble des revenus, y compris ceux imputés) sont comparées à celles des seuls revenus issus de l’enrichissement. Il s’avère que les distributions après imputations diffèrent globalement très peu de celles avant imputations.