Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

MedGemma 1.5: 3D-анализ КТ и МРТ в открытом ИИ

Google представил обновление MedGemma 1.5 — первую открытую модель ИИ для анализа 3D-снимков КТ и МРТ, плюс MedASR для распознавания медицинской речи. Новинка показывает рост точности в диагностике и извлечении данных из историй болезни, но требует доработки и сертификации для клиник. Конкуренция в медицинском ИИ накаляется: OpenAI и Anthropic тоже активно развивают свои решения.

14 января 2026 г.
4 мин
65

Google обновил открытую медицинскую модель ИИ MedGemma 1.5, сделав её первой публичной языковой моделью, которая разбирает трёхмерные снимки КТ и МРТ.

Сфера здравоохранения внедряет генеративный ИИ примерно вдвое быстрее, чем остальная экономика, по данным Google Research. Чтобы помочь этому процессу, компания представила MedGemma 1.5 4B — улучшенную версию открытой модели для анализа медицинских изображений, — а также MedASR, новую модель распознавания речи, заточенную под медицинскую диктовку.

С момента запуска в прошлом году первая MedGemma набрала миллионы загрузок, по словам Google, и породила сотни вариантов от сообщества на Hugging Face.

Это обновление сильно расширяет возможности. Если раньше модель работала только с 2D-изображениями вроде рентгеновских снимков или фото кожи, то теперь MedGemma 1.5 обрабатывает 3D-объёмные данные с КТ и МРТ, а также гистопатологические препараты. Разработчики могут подавать на вход целые объёмы КТ-снимков сразу, без разбора по срезам.

Тот же подход используется для гистопатологии: модель изучает несколько срезов тканей одновременно. Так ИИ лучше замечает связи, которые ускользают при просмотре по отдельности. Google утверждает, что MedGemma 1.5 — первая открытая модель, справляющаяся с таким 3D-медицинским контентом, при этом не теряя понимания обычных изображений и текста.

Заметный рост точности диагностики

Внутренние тесты показывают серьёзный прогресс по сравнению с прошлой версией. Точность классификации КТ выросла на три пункта до 61%, а для МРТ — на 14 пунктов, почти до 65%.

Модель улучшилась и в задачах с текстом. На бенчмарке MedQA по медицинскому мышлению MedGemma 1.5 4B набрала 69%, против 64% раньше. Самый большой скачок — в извлечении данных из электронных историй болезни: с 68% до 90%.

Хотя прогресс очевиден, Google подчёркивает, что технологии пока на ранней стадии. Модель далека от идеала, но разработчики могут поднять результаты, дообучая её на своих данных.

Меньше ошибок при расшифровке речи в клинике

Google также выпустил MedASR — инструмент распознавания речи, обученный на медицинском словаре. По данным компании, он опережает универсальную Whisper large-v3 от OpenAI: на 58% меньше ошибок при расшифровке рентгеновских описаний и на 82% — при общей медицинской диктовке.

MedASR выполняет две роли: расшифровывает речь и служит голосовым интерфейсом для MedGemma, чтобы врачи общались с ИИ только голосом.

Ранние пользователи уже пробуют эти инструменты. Малайзийская Qmed Asia применила MedGemma для чат-интерфейса с клиническими рекомендациями по лечению, а администрация здравоохранения Тайваня обработала с её помощью свыше 30 000 патологоанатомических отчётов о операциях по раку лёгких.

Обе модели доступны бесплатно для исследований и коммерции на Hugging Face и Google Cloud Vertex AI. Но Google предупреждает: это базовые инструменты для разработчиков, а не готовые продукты для клиник. Их нужно проверять и адаптировать, выводы нельзя использовать для прямой диагностики или лечения.

Регуляторные барьеры для работы с пациентами

Хотя MedGemma открытая, она подпадает под «Health AI Developer Foundations Terms of Use». Эта лицензия строже стандартной Apache 2.0 для кода. В частности, применение весов модели для диагностики или лечения пациентов требует сертификации как медицинского устройства властями.

Разработчики, использующие MedGemma, обязаны передавать эти ограничения третьим сторонам. Google не несёт ответственности, не даёт медицинских советов и не претендует на авторство выводов моделей. Пользователи сами отвечают за их применение.

Гонка ИИ-лабов за лидерство в медицинском ИИ

Выпуск Google совпадает с обострением конкуренции. OpenAI недавно купила стартап Torch примерно за 100 миллионов долларов, чтобы создать «медицинскую память для ИИ», запустила функцию ChatGPT Health и сервис для поставщиков здравоохранения.

Anthropic тоже включилась с Claude for Healthcare — HIPAA-соответствующим решением, которое подключается к базам Medicare и PubMed в США. Эти шаги показывают веру отрасли в огромный рынок: сотни миллионов вопросов о здоровье, которые люди уже задают чатботам по всему миру.