Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Бенчмарк WorldVQA от Moonshot AI выявил, что топовые мультимодальные модели вроде Gemini 3 Pro (47,4%) и Kimi K2.5 (46,3%) не достигают 50% в точном распознавании визуальных объектов. Модели переоценивают свою уверенность и слабы в редких знаниях о природе и культуре. Это ограничивает их применение в реальных задачах и подчеркивает риски галлюцинаций.
Китайский стартап Moonshot AI закрыл раунд C на 500 миллионов долларов с оценкой 4,3 миллиарда. Деньги пойдут на модель K3 и вычисления, компания не спешит с IPO. Платящие пользователи Kimi растут на 170% в месяц, а Kimi-K2-Thinking бьет рекорды среди открытых моделей.
Moonshot AI выпустила Kimi K2.5 — открытую модель, которая координирует до 100 агентов для параллельного решения задач, сокращая время в 4,5 раза. Она сильна в кодинге фронтенда и анализе видео, лидирует в некоторых бенчмарках вроде BrowseComp и DeepSearchQA. Модель доступна онлайн и через Hugging Face.
Показаны все статьи (3)