Le logiciel ChatGPT remplacera-t-il bientôt votre médecin ?

Le générateur de textes ChatGPT est en passe de réussir un difficile examen de médecine aux États-Unis, ont démontré des chercheurs. L'intelligence artificielle serait-elle l'avenir de la médecine ?

Muriel Kaiser avec AFP
Muriel Kaiser avec AFP
Rédigé le , mis à jour le
Le logiciel ChatGPT se base sur une intelligence artificielle et se montre très performant
Le logiciel ChatGPT se base sur une intelligence artificielle et se montre très performant  —  Shutterstock

Depuis son lancement en novembre dernier, ChatGPT, fruit d'une start-up californienne, ne cesse de faire parler de lui. Le logiciel, qui se base sur une intelligence artificielle, répond aux questions en générant des textes - des dissertations, des articles ou même des poèmes. Le résultat est bluffant, et le domaine de la médecine ne fait pas exception.

En effet, des chercheurs ont démontré que ChatGPT est proche de réussir un examen de médecine aux États-Unis. Les résultats ont été publiés dans la revue PLOS Digital health jeudi 9 février.

À lire aussi : L'intelligence artificielle au service des urgences médicales

Jusqu'à 75% de bonnes réponses

Plus précisément, les chercheurs de l'entreprise AnsibleHealth ont testé les performances du logiciel dans divers domaines (connaissances scientifiques, raisonnement clinique, bioéthique...) demandés dans l'USMLE (United States Medical Licensing Examination). Cet examen est divisé en trois parties : la première a lieu après environ deux ans d'études, la deuxième au bout de quatre ans, et la troisième est requise pour devenir médecin.  

ChatGPT a été testé sur 350 des 376 questions publiées de l'examen de juin 2022 - les questions s'appuyant sur des images devant être retirées. Elles étaient présentées sous trois formats : des questions ouvertes ("que serait le diagnostic pour ce patient compte tenu des informations présentées?"), des questions à choix multiples sans justification ("Quelle est la prochaine étape de suivi la plus appropriée parmi les suivantes?"), et des choix multiples avec justification (Quelle est la raison la plus probable pour les symptômes nocturnes du patient? Expliquez votre raisonnement").  

Deux examinateurs ont noté le travail, et un troisième a tranché les écarts entre eux. Le logiciel a obtenu un score situé entre 52,4 % et 75 % de bonnes réponses. Généralement, le score nécessaire pour réussir l'examen est de 60 %. "ChatGPT s'approche de la marge de réussite", conclut l'étude. 

Une "aide aux diagnostics et aux prescriptions"

Si ces résultats sont impressionnants, certains experts extérieurs ont critiqué la méthode utilisée. Les chercheurs auraient ainsi pu introduire un certain degré d'anonymisation en mélangeant des réponses d'humains à celles du robot, a estimé Nello Cristianini, professeur en intelligence artificielle (IA) à l'université de Bath au Royaume-Uni. Il a malgré tout qualifié ces travaux comme faisant "partie d'une série de nouveaux développements enthousiasmants dans le domaine de l'IA".

Selon Lucia Ortiz de Zarate, chercheuse à l'université autonome de Madrid, cette étude démontre "le potentiel de l'IA dans le domaine médical". Elle "peut se révéler d'une grande aide pour les médecins lorsqu'ils formulent des diagnostics et prescrivent des traitements", a-t-elle jugé.  

Intelligence artificielle : mieux dépister le cancer du côlon
Intelligence artificielle : mieux dépister le cancer du côlon  —  Le Mag de la Santé - France 5