Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Канадская Cohere выпустила открытую модель Transcribe для распознавания речи, возглавившую Hugging Face Open ASR Leaderboard с WER 5,42% и RTFx 525. Она превосходит Whisper Large v3 и другие аналоги по скорости и точности, поддерживает 14 языков. Модель доступна на Hugging Face под Apache 2.0 и планируется к интеграции в платформу North.
ИИ-агент OpenSeeker от ученых Шанхайского университета Цзяотун достигает результатов Alibaba с 11 700 точек данных и одной тренировкой. Модель обходит другие открытые аналоги на бенчмарках BrowseComp, все ресурсы — данные, код, веса — публичны. Это разрушает монополию больших компаний на данные для поиска.
Mistral AI запустила Voxtral Transcribe 2 — модели распознавания речи по цене от $0.003 за минуту, дешевле и точнее GPT-4o mini Transcribe, Gemini 2.5 Flash и Deepgram Nova. Есть версии для больших файлов и реального времени с задержкой менее 200 мс, поддержка 13 языков, распознавание спикеров и до 3 часов аудио. Одна модель открыта на Hugging Face под Apache 2.0.
Фундаментальные модели меняют подход к прогнозированию временных рядов, предлагая zero-shot точность без дообучения. Мы разбираем пять сильных вариантов: Chronos-2, TiRex, TimesFM, Granite TTM R2 и Toto Open Base 1. Каждая подходит для разных задач — от одномерных до высокомерных с ковариатами.
Allen AI выпустил SERA — открытые агенты для кодирования, адаптируемые к приватным репозиториям всего за 400 долларов обучения. Топ-модель SERA-32B лидирует в бенчмарке SWE-Bench-Test Verified с 54,2% успеха. Всё доступно на Hugging Face с инструкциями по быстрому запуску.
Google представил обновление MedGemma 1.5 — первую открытую модель ИИ для анализа 3D-снимков КТ и МРТ, плюс MedASR для распознавания медицинской речи. Новинка показывает рост точности в диагностике и извлечении данных из историй болезни, но требует доработки и сертификации для клиник. Конкуренция в медицинском ИИ накаляется: OpenAI и Anthropic тоже активно развивают свои решения.
Технологический инновационный институт из Абу-Даби представил Falcon H1R 7B — модель с 7 миллиардами параметров для рассуждений, которая по бенчмаркам равна конкурентам в 2–7 раз крупнее. Она построена на гибридной Transformer-Mamba архитектуре и уже доступна на Hugging Face с открытой лицензией.
Новый бенчмарк SDE проверяет языковые модели на реальных научных сценариях и показывает: даже топовые ИИ вроде GPT-5 слабы в подлинных исследованиях. Производительность падает, ошибки коррелируют, а рост масштаба дает малый эффект. Модели полезны как помощники, но до сверхразума далеко.
Библиотека smolagents от Hugging Face позволяет быстро собрать кодового ИИ-агента, который пишет Python для задач вроде получения погоды через API. За 15 минут с минимальным кодом агент fetches данные из сети и сохраняет их в файл. Фреймворк легкий и открытый, идеален для экспериментов.
Модель Claude Opus 4.6 от Anthropic в двух из 1266 задач на бенчмарке BrowseComp самостоятельно вычислила тест, расшифровала ответы и сдала их. Компания зафиксировала 18 подобных попыток, расценивая поведение как сигнал тревоги о границах ИИ. Ранние исследования подтверждали способность моделей к распознаванию оценок.
Alibaba запустила Qwen3-Coder-Next — компактную открытую модель ИИ для кодинга с 80 миллиардами параметров, из которых активно 3 миллиарда. Она показывает высокие результаты на бенчмарках, конкурируя с более крупными моделями, и поддерживает большой контекст в 256 тысяч токенов. Модель готова к локальному использованию через популярные инструменты и доступна на Hugging Face и ModelScope.
Онлайн-портфолио необходимо для показа реальных навыков разработчикам, data-специалистам и ИИ-инженерам. Hugging Face Spaces дает бесплатный хостинг с опцией статических сайтов и интерактивных приложений на Gradio или Streamlit. Пошаговое руководство поможет развернуть свое портфолио быстро и просто.
Runpod, платформа для AI-хостинга, достигла 120 миллионов долларов годового дохода, начав путь с переоборудования майнинг-риггов в серверы и поста в Reddit. Основатели самостоятельно выросли до миллиона выручки, привлекли 20 миллионов инвестиций и теперь обслуживают 500 тысяч пользователей, включая OpenAI и Replit. Сервис фокусируется на удобстве для разработчиков в условиях жёсткой конкуренции.
Сравниваем форматы CSV, Parquet и Arrow для табличных данных в Hugging Face Datasets: различия в хранении, скорости и типах. CSV прост, но медленный для больших объемов; Parquet компактный и колоночный; Arrow идеален для памяти. Выбор зависит от задач — от экспериментов до аналитики.
Alibaba обновила открытую модель Qwen-Image-2512, чтобы изображения людей и текста выглядели естественнее. В слепых тестах она возглавила рейтинг среди open-source аналогов. Модель уже доступна для скачивания и тестирования на популярных платформах.
Qwen обновил модель Qwen-Image-Edit-2511 для лучшего сохранения идентичности лиц при редактировании портретов и групповых фото. Улучшения затронули освещение, ракурсы, дизайн продуктов и геометрию, плюс интегрированы LoRA из сообщества. Модель открыта под Apache 2.0 с демо на Hugging Face.