Chaînage de données hospitalières de patients produites en routine avec leurs données issues du registre national d’identification des personnes physiques : retour d’expérience

2018 
Introduction Dans le cadre d’une etude evaluant un score predictif dans la survenue d’un deces par evenement cardiovasculaire a 10 ans (SCORE) chez les patients d’une unite specialisee d’hypertension arterielle tertiaire (UHT), nous avons chaine les donnees hospitalieres de ces patients avec leur statut vital et leurs causes de deces le cas echeant issus du Registre national d’identification des personnes physiques (RNIPP). Nous nous proposons de faire un retour d’experience sur les resultats obtenus. Methodes Pour cette etude retrospective, monocentrique, nous avons inclus tous les patients ayant eu leur premiere visite dans l’UHT a l’hopital europeen Georges-Pompidou entre juin 2000 et decembre 2014. Les informations concernant le genre, la date et le lieu de naissance, les noms et prenoms de ces patients ont ete extraites de leur dossier administratif et de leur numero d’inscription au repertoire de l’Insee (NIR), notamment pour la commune de naissance obtenue a partir du code commune. Pour les patients pour lesquels ces informations etaient disponibles, le statut vital et les causes de deces ont pu etre demandes au Centre de recherche en epidemiologie et sante des populations (CESP) qui constitue l’intermediaire entre le RNIPP et la base de donnees nationale des causes de deces (CepiDc). Le fichier provenant du CESP comprend des patients identifies de facon exacte et des patients identifies avec une ou plusieurs discordances par rapport aux informations que nous avions fournies. Un traitement a du etre effectue pour traiter ces discordances et etablir la liste definitive des patients identifies. Les discordances concernant les noms et prenoms ont ete traitees de maniere automatique : le patient a ete considere comme identifie si une seule lettre du nom ou du prenom etait discordante apres suppression de la casse et des separateurs ou si pour deux lettres discordantes les deux premieres etaient les memes. Si la date de naissance etait discordante, le patient etait considere comme non identifie. Pour les patients nes a l’etranger, une discordance sur la ville de naissance (mais pas sur le pays) amenait le patient a etre considere comme identifie. Resultats Sur les 17 135 patients ayant eu une premiere visite entre juillet 2000 et decembre 2014, 15 438 (90 %) ont ete envoyes au CESP pour identification. Les donnees manquantes pour l’identification etaient essentiellement la ville de naissance, souvent non renseignee dans le dossier administratif et non recuperable via le NIR renseigne, qui est celui de l’ayant-droit. Parmi les patients envoyes, 1963 (12,7 %) n’ont pas ete identifies par le CESP ; 9940 (65 %) etaient identifies avec une ou plusieurs discordances mais apres le traitement automatique realise, seuls 811 (5,3 %) patients n’ont pas ete consideres comme identifies (date de naissance : 66 ; lieu de naissance : 23 ; nom : 724 ; prenom : 14). Les femmes etaient 61 % a etre identifiees contre 80 % des hommes. Au final, 4471 (26 %) patients n’ont pas ete inclus pour cause de donnees erronees/manquantes. Conclusion L’utilisation des bases de donnees nationales est un outil important pour la recherche epidemiologique qui peut etre limitee par la qualite des bases de donnees hospitalieres. Notre cas d’etude avec elaboration d’un algorithme ad hoc a permis de recuperer seulement 74 % des statuts vitaux des patients, avec un fort desequilibre en faveur des hommes.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []
    Baidu
    map