Anthropic приобрела стартап Vercept, чтобы значительно усилить возможности Claude в работе с компьютером. Разработчики Vercept создали ИИ-систему, которая запускается прямо на устройстве пользователя, анализирует содержимое экрана и выполняет поставленные задачи. Основатели Киана Эхсани, Лука Вайхс и Росс Гиршик переходят в Anthropic вместе со своей командой. Сумма сделки не раскрывается.
Технологии Vercept позволяют решать ключевые вызовы в области восприятия и взаимодействия при управлении компьютером с помощью ИИ, подчеркивает Anthropic. С их помощью модель может разбираться в интерфейсах, созданных для людей, и управлять ими на основе скриншотов, не требуя специального программного интерфейса вроде API.
В ближайшие недели Vercept прекратит работу своего десктопного ИИ-агента «Vy». Интерес Anthropic, вероятно, вызвала модель распознавания интерфейсов «VyUI», которая показала лучшие результаты по сравнению с технологиями OpenAI в бенчмарках.
| Бенчмарк (идентификация элементов UI / grounding) | Точность VyUI | Модель OpenAI |
|---|---|---|
| ScreenSpot v1 | 92% | 18.3% |
| ScreenSpot v2 | 94.7% | 87.9% |
| GroundUI Web | 84.8% | 82.3% |
Claude уже способен выполнять многоэтапные задания в запущенных приложениях. С выходом модели Sonnet 4.6 он набрал 72,5% на бенчмарке OSWorld, оценивающем выполнение реальных компьютерных задач, — против менее 15% в конце 2024 года. Команда Vercept способна поднять этот результат еще выше.