Médecine : l’IA dépasse des médecins dans certains tests de raisonnement clinique

Une étude publiée dans Science a évalué les performances d’un grand modèle de langage, OpenAI o1, dans des tâches proches du raisonnement médical. Les chercheurs ont comparé l’IA à des centaines de médecins sur plusieurs exercices : proposer des diagnostics possibles, identifier les prochaines étapes de prise en charge et analyser des cas complexes, y compris des situations issues des urgences.

Les résultats sont impressionnants : dans les six expériences menées, le modèle a égalé ou dépassé les performances humaines. Son avantage semblait particulièrement marqué lorsque les informations étaient limitées, comme au début d’une prise en charge aux urgences. L’IA parvenait alors à exploiter des données fragmentaires pour proposer des hypothèses diagnostiques pertinentes.

Cette avancée montre que les modèles d’IA ne se contentent plus de réussir des examens médicaux théoriques. Ils deviennent capables d’aider à structurer le raisonnement clinique, notamment en suggérant des diagnostics rares ou en évitant certains oublis. Cela pourrait, à terme, réduire les retards diagnostiques et améliorer l’accès à une expertise médicale.

Mais les auteurs et plusieurs experts restent prudents. L’étude portait surtout sur des tâches textuelles et encadrées, alors que la médecine réelle exige aussi l’examen physique, l’écoute du patient, l’intuition clinique, la coordination d’équipe et la responsabilité des décisions. L’IA ne doit donc pas remplacer le médecin, mais plutôt servir d’outil d’aide à la décision.

Ainsi, cette étude marque une étape importante : l’intelligence artificielle pourrait devenir un partenaire puissant du diagnostic médical, à condition d’être évaluée dans des essais cliniques réels, avec des règles strictes de sécurité, de transparence et de supervision humaine.

Médecine : l’IA dépasse des médecins dans certains tests de raisonnement clinique

Leave a reply

Helping You Succeed

Contact