Дефицит данных тормозит ИИ в биомедицине
Большие языковые модели, обученные на огромных объёмах данных, способны ускорить исследования в геномике, упростить ведение клинической документации, улучшить диагностику в реальном времени, помочь с принятием решений в клиниках, ускорить поиск лекарств и даже создавать синтетические данные для экспериментов.
Однако их потенциал в преобразовании биомедицинских исследований часто упирается в нехватку данных: помимо структурированной информации, на которую опирается здравоохранение, модели плохо справляются с редкими заболеваниями и нетипичными ситуациями, где трудно найти надёжные и репрезентативные примеры.
Компания Mantis Biotech из Нью-Йорка предлагает выход из этой ситуации. Её платформа объединяет разрозненные источники данных, генерирует синтетические наборы и строит так называемые цифровые двойники человеческого тела — физически точные предиктивные модели анатомии, физиологии и поведения.
Применение цифровых двойников
Такие двойники подходят для агрегации и анализа данных. С их помощью можно изучать новые медицинские процедуры, обучать хирургических роботов, моделировать проблемы со здоровьем или даже шаблоны поведения. Например, спортивная команда способна оценить риск травмы ахиллова сухожилия у конкретного игрока НФЛ по его последним выступлениям, нагрузкам на тренировках, питанию и стажу в профессии, рассказала основательница и CEO Mantis Biotech Джорджия Витчел в беседе с TechCrunch.
Для создания двойников платформа собирает информацию из учебников, камер захвата движения, биометрических датчиков, журналов тренировок и медицинских снимков. Затем LLM-система распределяет, проверяет и синтезирует потоки данных, а физический движок превращает их в реалистичные рендеры. Эти рендеры идут на обучение предиктивных моделей.
Благодаря этому удаётся из разрозненных источников строить модели предсказания производительности людей. Это идеально подходит для любых задач, где нужно угадать, как человек себя поведёт, отметила Витчел.
Слой с физическим движком особенно важен: он обогащает данные, привязывая синтетику к реальности и точно моделируя физику тела.
Если попросить оценить позу руки у человека без пальца, задача окажется крайне сложной — публичных размеченных датасетов с такими примерами нет. Платформа Mantis генерирует их без проблем: берёт физическую модель, убирает нужный палец и пересчитывает всё заново, пояснила Витчел.
Широкие перспективы в отрасли
Поскольку платформа закрывает пробелы в данных, Витчел видит для неё применение по всей биомедицинской сфере, где сведения о процедурах или пациентах часто недоступны, неструктурированы или разбросаны. Особо она выделила редкие случаи и заболевания: здесь данные собирать сложно из-за этических и регуляторных барьеров на использование реальных записей в публичных наборах или для обучения ИИ.
Представьте трёхлетнего ребёнка, который таскает Барби за ногу и бьёт ею по столу. Вот такого подхода я жду к нашим цифровым двойникам. Это убедит людей тестировать виртуальных персонажей вместо реальных. Сейчас всё наоборот — и это правильно, учитывая приватность. Данные людей вообще не стоит эксплуатировать, особенно когда есть такие двойники, — сказала Витчел.
Пока Mantis добилась результатов в профессиональном спорте — там нужно моделировать топовых атлетов. Один из ключевых клиентов — команда НБА.
Платформа строит цифровые копии спортсменов: показывает, как тот или иной прыгал не только сегодня, но за весь прошлый год, как меняются прыжки в зависимости от сна или количества подъёмов рук над головой, описала Витчел.
Инвестиции и будущие шаги
Стартап привлёк 7,4 миллиона долларов на посевном раунде. Лид-инвестор — Decibel VC, участвовали Y Combinator, несколько бизнес-ангелов и Liquid 2. Деньги пойдут на найм, продвижение, маркетинг и запуск на рынок.
Дальше Mantis планирует дорабатывать технологию и открыть платформу для всех, сосредоточившись на превентивном здравоохранении. Компания также ориентируется на фармлаборатории и исследователей клинических испытаний FDA, чтобы давать данные о реакции пациентов на терапию.