Quand big data est futile

La donnée est devenue le nouvel eldorado des chercheurs de pépites. L’utilisation des Big Data est en passe de devenir le graal du savoir médical. La récupération de grands jeux de données et leur moulinage dans des logiciels de statistiques doivent, si on en croit nos prophètes digitaux, résoudre tout les problèmes et combler toutes les failles de la connaissance. Le spécialiste, quand on veut lui faire là peau on l’appelle « expert », n’a qu’à bien se tenir. Sa parole n’aura aucun point face à l’avalanche de données. Au mieux, il servira à produire ces chiffres, au pire, c’est un emmerdeur réactionnaire qui s’oppose à l’avancée de la science et du business.

Je crois à l’utilisation de ces monceaux de données, je suis convaincu de l’intérêt de big data. Je pense juste qu’il faut parfois analyser les résultats à la lumière d’un truc qui parait un peu obsolète, mais qui est finalement important, qui s’appelle l’expérience clinique de terrain.

Un blogueur/twitoss m’a signalé ce tweet. Je le remercie chaleureusement.

tweet HDInquiétant, l’hémodialyse en urgence double le risque de mortalité, j’adore le Oops. Oh, la méchante technique qui tue les gens. Je suis aller jeté un coup d’œil sur l’article, ce qu’on devrait toujours faire avant de tweeter avec un Oops.

Le titre original est « Survival after Acute Hemodialysis in Pennsylvania, 2005–2007: A Retrospective Cohort Study » publié dans Plos One en Aout 2014. Brièvement, les auteurs ont utilisé un jeu de données reposant sur plus de deux millions d’admission entre 2005 et 2007. Ils ont identifié 6657 cas nécessitant de l’hémodialyse en urgence et ils ont comparé la survie de ces patients à la cohorte et quand même dans un deuxième temps, ils ont ajusté la comparaison avec un score de propension. Il s’agit d’une étude de registre donc les auteurs n’ont que les données présentent, en particulier, il ajuste sur la donnée insuffisance rénale aigue à l’entré, oui/non, sans tenir compte de la sévérité de cette dernière. Les autres variables d’ajustement sont dans la légende de la figure 3.

Tout le message de l’article tient dans cette figure 3.

Si on a du dialyser en urgence, on a plus de chance de mourir dans l’année qui suit que si on a pas dialysé. Pour les auteurs, c’est le résultat majeur. Ceci va contre le fait qu’on pense que la dialyse sauve la vie des gens. Ce résultat est robuste car il est ajuste sur les comorbidités à l’entrée. Ensuite la discussion n’est qu’une litanie contre la technique.

Les auteurs manifestement n’ont jamais eu à faire de la dialyse en urgence. Il est rare qu’on dialyse les gens juste pour le plaisir de mettre un cathéter et de voir tourner le sang dans le circuit extra-corporel. Leur ajustement ne veut rien dire. On ne peut pas comparer un patient avec 150 µmol/l de créatinine, où l’intérêt de la dialyse est nul, à un patient à 1000 µmol/l de créatinine en œdème aigu du poumon et anurique, que la dialyse va sauver. Ce travail dit juste que le fait de dialyser est un facteur prédictif de mortalité à un an. Il ne permet en aucun cas de dire c’est la dialyse qui tue comme les auteurs le sous entendent durant tout l’article et je ne parle pas de la reprise en 140 caractères. Cet article est franchement mauvais et peut conduire à des interprétations dangereuses.

Je demande juste aux auteurs de l’article et à tout ceux qui le trouvent formidable de participer à ma prochaine étude randomisée qui consistera à comparer hémodialyse en urgence contre traitement conservateur en cas d’hyperkaliémie anurique, d’OAP anurique ou d’une créatininémie à 1200 µmol/l après avoir éliminé bien sur les insuffisances rénales aiguës fonctionnelles et obstructives. Je rappelle juste cet article de 2003, qui montrait que de ne pas débuter la dialyse chez des patients octogénaires était associé à une diminution de leur espérance de vie (médiane de 29 mois contre 9 mois).

Le design de mon projet est directement inspiré de cet article.

Le big data c’est bien, mais son utilisation et son interprétation raisonnée, c’est mieux. Alors avant de vous laissez impressionner par des chiffres, lisez l’article original de façon critique et si vous ne connaissez pas le sujet demandez son avis à une personne avec un peu d’expérience. Parfois les reviewers font leur travail d’une drôle de façon.

Ce contenu a été publié dans Medecine, Médecine humeur, Néphrologie, avec comme mot(s)-clé(s) , , , . Vous pouvez le mettre en favoris avec ce permalien.

3 réponses à Quand big data est futile

  1. Gélule dit :

    Le 2e enseignement est donc, comme d’habitude, de vérifier ses sources (cf le tweet avec « oops »)

  2. Ca m’atterre toujours les papiers de ce type où les gens ne se rendent pas compte que ce qui justifie la thérapeutique en urgence, c’est la gravité de la chose et que par conséquent, c’est normal qu’ils meurent plus.

    Bref. Je retiendrais toujours ce qu’à dit un prof en cours, avant le sens clinique, il y’a déjà le bon sens.

  3. DM dit :

    Très intéressant. En informatique. on voit souvent passer des projets pour étudier (statistiques, machine learning, whatever) des données médicales et où l’on nous fait miroiter que l’ordinateur pourra prédire quel tel traitement sera meilleur. Ça me fait un peu peur, notamment en raison 1) de la sensibilité aux choix des données fournies 2) au fait que corrélation n’implique pas causation, et même si causation, pas dans le sens indiqué 3) au fait qu’à force de « miner » sur de gros volumes on trouve forcément des corrélations non pertinentes. Associé à l’effet de mode (facile d’annoncer ce genre de « découvertes »), cela peut faire des dégâts.

Laisser un commentaire