Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Команда Bing от Microsoft открыла модель эмбеддингов Harrier, возглавившую бенчмарк MTEB v2 и обошедшую OpenAI с Amazon. Поддерживает 100+ языков, контекст 32k токенов, обучена на 2 млрд примеров с данными GPT-5. Доступны версии 27B, 0.6B и 270M на Hugging Face.
Google анонсировал Gemini Embedding 2 — мультимодальную модель эмбеддингов, которая объединяет текст, изображения, видео, аудио и PDF в единое пространство. Она лидирует в бенчмарках над Amazon Nova 2 и Voyage 3.5, поддерживает смешанные запросы и нативную обработку аудио. Модель доступна в Gemini API и Vertex AI с готовыми интеграциями.
Системы RAG развивают LLM, устраняя галлюцинации и проблемы с актуальными знаниями. Статья разбирает семь шагов: от очистки данных и разбиения на чанки до векторизации, хранения, извлечения контекста и генерации ответов. Это позволяет создавать надежные ИИ-приложения на свежих данных.
Perplexity представила открытые модели эмбеддингов pplx-embed-v1 и pplx-embed-context-v1 в версиях 0,6B и 4B параметров, которые конкурируют с Google и Alibaba по качеству при 4–32 раза меньшем расходе памяти. Благодаря двунаправленному обучению и квантизации они лидируют на MTEB, ConTEB и внутренних бенчмарках. Модели подходят для масштабируемого поиска в RAG-системах.
Показаны все статьи (4)