Finale de l'IA DXA-nation. L'IA peut voir la fin ! Apprentissage profond... | par Lambert T Leong, PhD

MODÈLES D’IA BASÉS SUR L’IMAGERIE LONGITUDINALE POUR LA SANTÉ ET LA MÉDECINE

L’IA peut tout voir ! L’apprentissage approfondi prédit la mortalité toutes causes confondues à partir d’images de composition corporelle uniques et séquentielles

L’imagerie DXA offre de nombreuses visualisations de la composition corporelle. (Image de l’auteur)

POINTS CLÉS, TLDR :
– La combinaison de l’imagerie de la composition corporelle et des métadonnées (âge, sexe, force de préhension, vitesse de marche, etc.) a donné les meilleures prédictions de mortalité sur 10 ans.
– Les modèles longitudinaux ou séquentiels ont globalement mieux performé que les modèles sur un seul enregistrement, soulignant l’importance de modéliser le changement et les dépendances temporelles dans les données de santé.
– Les modèles longitudinaux ont le potentiel de fournir une évaluation plus complète de la santé d’une personne.

Lisez l’article

L’intelligence artificielle (IA) et l’apprentissage automatique (ML) révolutionnent les soins de santé, nous conduisant vers l’ère de la médecine de précision. La motivation pour développer des modèles de santé basés sur l’IA est de réduire les décès et les maladies, tout en prolongeant une qualité de vie élevée. Les modèles bien entraînés ont la capacité d’analyser plus en profondeur les données qui sont présentées, ce qui offre une évaluation plus complète de la santé d’une personne.

Les modèles d’IA/ML médicaux basés sur l’imagerie ont maintenant atteint une maturité où ils rivalisent souvent, voire surpassent, les performances humaines, identifiant avec habileté des modèles et des anomalies qui pourraient échapper facilement à l’œil humain. Cependant, la majorité de ces modèles fonctionnent encore sur des données d’un seul instant, fournissant un instantané isolé de la santé à un moment spécifique. Qu’il s’agisse de modèles uni-modaux ou multi-modaux, ils ont tendance à travailler avec des données collectées dans une période relativement similaire, formant la base d’une prédiction. Pourtant, dans le contexte plus large de l’IA/ML pour les applications médicales, ces modèles d’un seul instant représentent seulement la première étape – le fameux “fruit facile”. Une frontière de la recherche médicale en IA est constituée par les modèles longitudinaux, qui offrent une vue plus holistique de la santé d’une personne au fil du temps.

Les modèles longitudinaux sont conçus pour intégrer des données provenant de plusieurs instants, capturant la trajectoire de santé d’un individu plutôt qu’un moment isolé. Ces modèles exploitent la nature dynamique de la santé humaine, où les changements physiologiques sont constants. La capacité de cartographier ces changements à des résultats spécifiques ou à des questions de santé pourrait révolutionner les soins prédictifs de santé. Le concept de données longitudinales n’est pas nouveau dans la pratique clinique – il est régulièrement utilisé pour surveiller le vieillissement et prédire la fragilité. Un exemple typique est le suivi de la densité minérale osseuse (BMD), un indicateur clé de l’ostéoporose et de la fragilité. Des évaluations régulières de la BMD peuvent détecter des diminutions significatives, indiquant des risques potentiels pour la santé.

Historiquement, le développement de modèles longitudinaux a été confronté à plusieurs défis importants. Outre les volumes de données plus importants et le calcul requis par individu, le plus grand obstacle réside dans la curation des données médicales longitudinales elles-mêmes. Contrairement aux données d’un seul instant, les données longitudinales impliquent le suivi des informations de santé des patients sur de longues périodes, souvent dans plusieurs établissements de santé. Cela nécessite une organisation et une gestion minutieuses des données, rendant le processus de curation à la fois long et coûteux. Plusieurs études réussies ont été financées pour collecter de manière prospective des données longitudinales. Ces études signalent des défis en ce qui concerne le maintien des patients sur une longue période d’observation. Par conséquent, malgré les avantages potentiels des modèles longitudinaux, leur développement est resté une entreprise complexe et gourmande en ressources.

Les changements dans la composition corporelle, les proportions de tissus mous maigres et gras et d’os, sont connus pour être associés à la mortalité. Dans notre étude, nous avons cherché à utiliser des informations sur la composition corporelle pour mieux prédire la mortalité toutes causes confondues, en termes plus simples, le calendrier probable de la vie d’une personne. Nous avons évalué les performances de modèles construits à partir de données uniques et longitudinales, respectivement appelés nos modèles “single record” et “séquentiels”. Les modèles d’un seul enregistrement nous ont permis d’évaluer quel type d’informations était le plus prédictif de la mortalité. Le développement de modèles séquentiels avait pour objectif de capturer les changements dans le temps et d’évaluer comment cela affecte les prédictions de mortalité.

Les données de cette étude ont été acquises auprès d’une étude longitudinale connue sous le nom d’étude Health, Aging, and Body Composition (Health ABC), dans laquelle plus de 3000 adultes plus âgés de différentes races ont été suivis et surveillés pendant 16 ans au maximum. Cette étude a donné lieu à un ensemble de données longitudinales riche et complet. Dans le cadre de cette étude, les patients ont subi une imagerie par absorptiométrie biphotonique à rayons X du corps total (TBDXA), et plusieurs éléments de métadonnées ont été collectés (voir tableau XXX). Conformément aux meilleures pratiques de modélisation et pour éviter les fuites de données ou atténuer le surajustement, les données ont été réparties en ensemble d’entraînement, de validation et de test, en utilisant une répartition de 70%/10%/20%.

Nous quantifions la composition corporelle en utilisant l’imagerie par absorptiométrie biphotonique à rayons X du corps total (TBDXA), qui est depuis longtemps considérée comme une modalité d’imagerie de référence. Historiquement, les métadonnées des patients, qui incluent des variables telles que l’âge, l’indice de masse corporelle (IMC), la force de préhension, la vitesse de marche, etc., ont été utilisées pour évaluer le vieillissement/la mortalité et utilisées comme mesure substitutive de la composition corporelle. L’utilisation prédominante des métadonnées des patients et des mesures substitutives de la composition corporelle était motivée par l’accès limité aux scanners DXA. L’accessibilité s’est considérablement améliorée récemment, les scanners étant devenus moins chers et ne nécessitant plus de prescription médicale.

Trois modèles uniques ont été construits, chacun avec différentes entrées de données, mais tous avec la même sortie, à savoir une probabilité de mortalité sur 10 ans. Le premier modèle a été construit pour prendre uniquement les métadonnées des patients, et il s’agit d’un réseau neuronal avec une seule couche cachée d’activation ReLU de 32 unités et une couche de prédiction sigmoïde. Le deuxième modèle n’utilisait que les images TBDXA en entrée et était constitué d’un Densenet121 modifié pour gérer les deux canaux de couleur au lieu des trois canaux de couleur (RVB) que l’on trouve dans la plupart des images naturelles. La nature biphotonique de la DXA donne des images de rayons X hautes et basses qui sont entièrement enregistrées et empilées dans deux canaux d’image. Le troisième modèle combine l’apprentissage des métadonnées du modèle un avec les apprentissages des images TBDXA du modèle deux, puis le fait passer par une couche entièrement connectée ReLU de 512 unités, une couche entièrement connectée ReLU de 64 unités, et enfin une couche de prédiction sigmoïde.

Diagramme des entrées de données, des architectures de modèles et des méthodes pour les modèles uniques (Image des auteurs)

Trois modèles séquentiels ont été construits et évalués. Les architectures des modèles uniques ont servi de base pour chaque modèle séquentiel, mais les couches de prédiction sigmoïde ont été supprimées afin que la sortie soit un vecteur représentant les embeddings de caractéristiques. Au cours de l’étude, des données ont été collectées auprès de chaque patient à plusieurs moments. Les données de chaque instant ont été entrées dans les modèles appropriés pour obtenir le vecteur de caractéristiques correspondant. Les vecteurs de caractéristiques de chaque patient ont été ordonnés et empilés pour former une séquence. Un modèle de mémoire à court terme à long terme (LSTM) a été entraîné pour prendre la séquence de vecteurs de caractéristiques et générer une prédiction de mortalité sur 10 ans. Comme mentionné précédemment, il existe plusieurs difficultés liées à la réalisation d’études à long terme, avec la rétention des patients et la collecte de données posant souvent problème. Notre étude n’était pas exempte de ces problèmes, et certains patients avaient plus de points de données que d’autres en conséquence. Un modèle LSTM a été choisi comme approche de modélisation séquentielle car il n’est pas contraint d’utiliser la même longueur de séquence d’entrée pour