Журналисты трубят: искусственный интеллект (ИИ) в медицинской практике демонстрирует лучшие результаты в диагностике и принятии решений по сравнению с врачами. Но так ли всё однозначно?
Была изучена эффективность работы врачей с использованием ИИ и ИИ без участия врачей, охватывающая такие аспекты, как диагностические методы обследования, точность диагностики и управленческое мышление (табл. 1). Результаты оказались неожиданными: в ряде случаев ИИ выполнял задачи более эффективно без участия врачей, чем с ними. Эта тенденция наблюдалась в самых разных медицинских задачах, включая интерпретацию рентгенографии грудной клетки, маммографию и принятие клинических решений. В некоторых исследованиях разница в производительности в пользу ИИ была весьма значительной1 .
Таблица 1. Исследования, посвященные оценке эффективности применения ИИ в медицине
Задача для интерпретации |
Сравнение с ИИ |
Дизайн исследования |
Основные результаты (ИИ vs Врач + ИИ) |
Ссылка |
Рентгенография органов грудной клетки |
227 радиологов |
Рентгенографии по 15 заболеваниям |
ИИ лучше, чем 2/3 врачей + ИИ |
Agarwal, NBER, 2024 |
Маммография |
14 радиологов |
Диагностика онкологии |
0,94 vs 0,88 |
Kim H. E., Lancet Digital Health, 2020 |
Рентгенография органов грудной клетки |
13 врачей общей практики |
Диагностика туберкулеза |
0,79 vs 0,65 |
Rajpurkar P., NPJ Digital Medicine, 2020 |
Точность диагностики |
20 терапевтов |
РКИ NEJM |
0,59 vs 0,52* |
McDuff D., arXiv, 2023 |
50 врачей общей практики |
РКИ GPT-4 |
0,90 vs 0,76 |
Goh E., JAMA Network Open, 2024 |
|
Принятие решений |
25 врачей общей практики |
GPT-o1, 5 задач |
86% vs 41%** |
Brodeur P., arXiv, 2024 |
*Точность топ-10; **Медиана GPT-o1 vs Врач+GPT-4
Так, например, в 92% случаев ИИ самостоятельно «ставил» правильный диагноз, в то время как врачи, использующие помощь ИИ, были точны только в 76% случаев. При этом точность постановки диагноза врачами без использования ИИ составила 74%. Эти результаты могут указывать на то, что сейчас простое предоставление врачам инструментов ИИ и ожидание автоматических улучшений не работает. Врачи не совсем довольны ИИ и всё еще сомневаются в его полезности2 .
Однако небольшое количество исследований и малые выборки некоторых из них заставляют задуматься о преждевременности однозначных суждений. И возникает вопрос: не является ли это целенаправленным формированием общественного мнения?
Авторы статьи считают, что ключ к успеху состоит в определении, какие задачи больше подходят для выполнения ИИ, какие лучше доверить медицинским работникам и какие могут выиграть от совместной работы. Успех заключается не в замене врачей на ИИ, а в создании эффективного партнерства. К примеру, ИИ может заняться первичным скринингом, в то время как врачи сосредоточатся на более сложных случаях, где важен более детальный подход1 .
С развитием искусственного интеллекта становится очевидным, что будущее медицины не будет определяться простым выбором между человеческим и искусственным интеллектом. Основное внимание следует уделить пониманию их сильных и слабых сторон и формированию взаимодействия, которое будет приносить реальную пользу пациентам1 .
Предстоящая задача не только технологическая, но также требует переосмысления ролей как врачей, так и ИИ в предоставлении медицинских услуг. Хотя заголовки могут намекать на появление «роботов-врачей» (так The New York Times назвала статью авторов), факты указывают на более сложную картину: необходим поиск правильного баланса между человеческим опытом и искусственным интеллектом с целью улучшения и трансформации медицинской практики. Это может потребовать отказа от некоторых устоявшихся предубеждений и принятия новых, возможно, изначально нелогичных моделей, которые в итоге окажутся более эффективными для пациентов1 .
Источники:
1. www.medscape.com/s/viewarticle/when-doctors-ai-are-outperformed-ai-alone-2025a10002nn
2. erictopol.substack.com/p/when-doctors-with-ai-are-outperformed