L’intelligence artificielle (IA) est devenue incontournable en sante, notamment pour le diagnostic. L’IA est deja une grande alliee des medecins pour reperer le cancer du sein et ceux de la peau, entre autres. Mais ces modeles informatiques sont souvent beaucoup trop specialises, difficilement adaptables a d’autres maladies. Toutefois, l’arrivee de nouvelles IA dites de modeles de fondation pourrait changer la donne. Ces modeles sont entraines avec une grande variete de donnees, ce qui les rend tres versatiles a l’image de ChatGPT et les autres grands modeles de langage.
Des chercheurs de l’Universite Lehigh, de l’Hopital general de Massachusetts et de l’Universite de Harvard (Etats-Unis) ont cree BiomedGPT, un modele de fondation entraine exclusivement avec des donnees medicales, qui permet de diagnostiquer avec precision un grand nombre de maladies. Les scientifiques l’ont presente dans la revue Nature Medicine.
Une IA faite sur mesure
ChatGPT, Llama, Gemini… Toutes ces IA sont tres puissantes grace a la quantite d’informations qu’elles ont analysees. Pourtant, elles ne sont pas tres fiables en ce qui concerne la medecine. « Elles n’ont pas acces a beaucoup de donnees medicales, car la plupart ne sont pas publiees sur internet pour proteger la vie privee des patients, nous explique Lichao Sun, professeur de sciences informatiques a l’Universite Lehigh et createur de BiomedGPT. En consequence, elles n’ont pas forcement de bons resultats en diagnostic medical. »
Son modele est au contraire entraine uniquement avec des donnees medicales, dont pres de 600.000 images medicales ainsi que pres de 200 millions de phrases medicales a l’ecrit. Ce qui semble enorme, mais ce n’est pourtant rien a cote de la quantite presque infinie que ChatGPT et d’autres modeles de langage ont ingurgite en analysant tout ce qu’ils pouvaient trouver sur internet. En consequence, BiomedGPT est beaucoup plus petit, mais bien plus precis. « Et en plus les donnees restent sur place, on n’a pas a les envoyer a un serveur exterieur comme ca serait le cas si on utilisait ChatGPT, poursuit-il. Les hopitaux veulent pouvoir traiter leurs donnees medicales de facon autonome. La seule facon d’y parvenir etait de creer et d’entrainer un modele qui leur est propre. »
Lire aussiWhy l’IA generative is prone to mentir
Petite taille, mais grande precision
Certains grands modeles de langage ont ete concus specifiquement pour la medecine. C’est le cas notamment de Med-PaLM, developpe par Google. Sa version multimodale analyse du texte, mais aussi des images, et sa version la plus robuste compte 562 milliards de parametres ! BiomedGPT est 3.000 fois plus petite, mais fait cependant tout aussi bien. Les chercheurs ont teste leur modele sur 25 taches differentes, y compris l’analyse de radiologies medicales, et ses resultats etaient excellents dans la majorite d’entre elles. Et il s’en sortait aussi bien que les vrais experts dans l’ecriture de rapports medicaux.
Un modele facilement installable partout
« Le modele a ete evalue sur des donnees de l’Hopital general de Massachusetts avec de bons resultats, confirme Xiang Li, professeur de radiologie a cet hopital et a l’Universite de Harvard. Nous examinons maintenant comment il pourrait etre integre dans le fonctionnement de l’hopital, ce qui sera facilite par sa petite taille. » Car sa legerete permet de l’installer sur des petits ordinateurs, contrairement aux grands modeles de langage commerciaux qui necessitent une connexion internet et d’enormes serveurs informatiques. « Cela permettra par exemple de l’installer sur les equipements, comme les machines a ultrasons, poursuit-il. Et on ne dependra pas d’internet, car une mauvaise connexion peut causer des retards, et en medecine, tout retard peut etre grave. »