https://www.jim.fr/e-docs/00/02/A8/6F/carac_photo_1.jpg Publié le 15/10/2018

Le scanner cérébral sans injection de produit de contraste est l’un des actes d’imagerie les plus couramment pratiqués dans les services de radiologie. Il est souvent demandé en première intention et en urgence face à un traumatisme crânien, un AVC ou encore des céphalées faisant craindre une hypertension intracrânienne (HIC). De fait, la rapidité de l’acquisition et la diffusion très large sont les atouts qui lui valent sa place actuelle dans les stratégies diagnostiques. La sémiologie radiologique est assez standard, centrée sur des signes révélateurs d’une hémorragie intracérébrale, d’une  fracture du crâne ou encore d’une HIC. L’interprétation des images doit être à la fois rapide et précise, notamment dans le contexte de l’urgence mais il est certains diagnostics difficiles : c’est le cas par exemple de certaines fractures du crâne dont les signes radiologiques peuvent être mineurs. Il est évident qu’un système de lecture automatique du scanner crânien avec interprétation fiable à la clé est le bienvenu, a fortiori dans les services surchargés par les urgences vasculaires ou traumatologiques où le temps est une variable qui compte plus qu’ailleurs.

L’apprentissage profond à l’œuvre

C’est là que peut intervenir l’intelligence artificielle reposant sur « l’apprentissage profond » par le biais de réseaux de neurones artificiels. L’intelligence artificielle a déjà fait ses preuves dans l’identification et l’évaluation de la rétinopathie diabétique, mais aussi dans la distinction entre les lésions cutanées bénignes et malignes. Les algorithmes développés dans ces indications à partir de l’apprentissage profond font preuve d’une exactitude diagnostique qui avoisine celle des médecins experts. La même tendance a été observée dans l’interprétation et la segmentation des clichés thoraciques et des scanners crâniens. D’une façon générale, en radiologie, le développement d’algorithmes par le biais de l’apprentissage profond suppose de choisir un bon modèle architectural et d’entraîner la machine à l’interprétation des images en lui soumettant un grand nombre de radiographies ou de scanners provenant de sources diverses, avec à chaque reprise, le diagnostic exact associé à la bonne image.
Une étude rétrospective publiée dans le Lancet donne une idée des performances d’un algorithme de ce type conçu pour interpréter automatiquement un scanner cérébral sans injection de produit de contraste en identifiant ou en détectant : (1) cinq types d’hémorragie intracérébrale : intraparenchymateuse, ventriculaire, sous-durale, extradurale ou encore sous-arachnoïdienne ; (2) les fractures de la voûte crânienne ; (3) un effet de masse ou un déplacement de la ligne médiane, en tant que signes témoignant de la sévérité d’un traumatisme crânien.

Des résultats éloquents

Au total ont été collectés 313 318 scanners cérébraux provenant de 20 centres de radiologie implantés en Inde, réalisés entre le 1er janvier 2011 et le 1er juin 2017. Un diagnostic avait été fait dans tous les cas. Ont été exclus les examens postopératoires et ceux effectués chez des sujets âgés de moins de 7 ans. Un échantillon (Qure25k dataset) a été extrait  au hasard de cette base de données pour la validation et le développement de l’algorithme. D’autres scanners (CQ500 dataset) ont été obtenus à partir d’autres centres de radiologie, différents de ceux impliqués dans les phases précédentes et séparés en deux lots. Le compte-rendu initial du radiologue a servi de gold standard pour les données Qure25K, alors que ce rôle a été rempli par le consensus de trois radiologues indépendants pour les données CQ500. Les performances de l’algorithme ont été évaluées au moyen des courbes ROC, notamment des AUCs (reasunder the receiver operating characteristic curves).

La série Qure25k dataset a comporté 21 095 scanners (âge moyen 43 ans ; femmes : 9 030 [43%]. La série CQ500, pour sa part, a consisté en un premier lot de 214 scanners (âge moyen 43 ans ; femmes : 94 [44 %] et un second lot de  277 (âge moyen 52 ans; femmes 84 [30%]. Pour ce qui est de la série Qure25k, les valeurs de l’AUC atteintes avec l’algorithme ont été estimées en fonction du type d’hémorragie : (1) intracrânienne tous types confondus: 0,92 (intervalle de confiance à 95 % IC  0,91–0,93) ; (2) intraparenchymateuse : 0,90 [IC 0,89–0,91] ; (3) 0,96 [IC 0,94–0,97] ; (4) sous-durale :0,92 [IC 0,90–0,93] ; (5) extradurale 0,93 [IC 0,91–0,95] (6) sous-arachnoïdienne [IC 0,89–0,92]. Dans la série CQ500, les AUC correspondantes ont été du même ordre. Pour ce qui est des autres signes, les AUCs dans la série Qure25k ont été respectivement de : (1) 0,92 (IC 0,91–0,94) pour les fractures du crâne ; (2) 0,93 (IC 0,91–0,94) pour le déplacement de la ligne médiane ; (3) 0,86 (IC 0,85–0,87) pour l’effet de masse. Dans la série CQ500, les valeurs correspondantes ont été respectivement de 0,96 (0,92–1,00), 0,97 (0,94–1,00) et  0,92 (0,89–0,95).

Cet algorithme basé sur l’apprentissage profond s’avère performant dans l’identification de certaines anomalies du scanner crânien sans injection de produit de contraste. Il s’agit en priorité d’une sémiologie précise et bien caractérisée, celle qui est recherchée dans le contexte de l’urgence : la traumatologie et les urgences neurovasculaires seraient les premières concernées. L’automatisation de l’interprétation faciliterait le travail du radiologue dans ces indications bien définies, mais il reste à préciser son bénéfice réel dans le cadre d’une étude prospective avant de l’introduire dans la pratique courante…Si l’intelligence artificielle est amenée à transformer l’imagerie médicale, ce sera de façon progressive et maîtrisée, sous la supervision des spécialistes de chacune de ses branches.

Dr Philippe Tellier

RÉFÉRENCE – Chilamkurthy S et coll. : Deep learning algorithms for detection of critical findings in head CT scans: a retrospective study. Lancet, 2018 ; publication avancée en ligne le 11 octobre.

Copyright © http://www.jim.fr