Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

Команда Bing открыла модель эмбеддингов Harrier

Команда Bing от Microsoft открыла модель эмбеддингов Harrier, возглавившую бенчмарк MTEB v2 и обошедшую OpenAI с Amazon. Поддерживает 100+ языков, контекст 32k токенов, обучена на 2 млрд примеров с данными GPT-5. Доступны версии 27B, 0.6B и 270M на Hugging Face.

вчера
2 мин
0

Команда, отвечающая за Bing в Microsoft, опубликовала открытую модель эмбеддингов Harrier. Она охватывает более 100 языков, работает с контекстным окном в 32 тысячи токенов и прошла обучение на свыше двух миллиардов примеров, дополненных синтетическими данными от GPT-5. По данным разработчиков, Harrier заняла первое место в многоязычном бенчмарке MTEB v2 и превзошла закрытые аналоги от OpenAI и Amazon.

Ранг (Borda)МодельZero-shotАктивные параметры (млрд)Общие параметры (млрд)Размерность эмбеддингаМакс. токены
1harrier-oss-v1-27b78%25.627.05376131072
2KaLM-Embedding-Gemma3-12B-251173%10.811.8384032768
3llama-embed-nemotron-8b99%7.07.5409632768
4Qwen3-Embedding-8B99%6.97.6409632768
5gemini-embedding-00199%30722048
6Qwen3-Embedding-4B99%3.64.0256032768
7Octen-Embedding-8B99%6.97.6409632768
8F2LLM-v2-14B88%13.214.0512040960
9F2LLM-v2-8B88%6.97.6409640960
10harrier-oss-v1-0.6b78%0.4400.596102432768

К основной версии с 27 миллиардами параметров добавили две облегченные — 0.6B и 270M, — чтобы их можно было запускать на не самых мощных устройствах. Все варианты выложены на Hugging Face с лицензией MIT. Далее технологию подключат к Bing и к новым сервисам заземления для ИИ-агентов.

Такие модели помогают ИИ-системам искать нужную информацию, извлекать ее и приводить в порядок для выдачи верных ответов. Microsoft подчеркивает: их значение растет, поскольку ИИ-агенты все чаще самостоятельно справляются со сложными задачами из нескольких шагов.