Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Индийская лаборатория Sarvam выпустила модели ИИ с 30 и 105 миллиардами параметров, рассчитывая на успех открытых решений против гигантов. Новинки обучены с нуля на огромных объемах данных индийских языков и предназначены для голосовых ассистентов и чатов. Компания фокусируется на практических задачах и планирует open-source публикацию.
Anthropic открывает офис в Бангалоре и анонсирует партнёрства в бизнесе, образовании и агросекторе Индии. Компания улучшает модели для индийских языков, помогает стартапам и НПО внедрять Claude. Индия — второй рынок платформы с сильным фокусом на технические задачи.
Большие языковые модели вроде GPT-4 уже переводят на уровне начинающих и средних специалистов, уступая лишь экспертам с 10+ годами опыта. Исследование показало различия в ошибках: модели бывают слишком буквальными, а люди — излишне interpretive. Модели с сильным мышлением приближаются к топ-уровню.
Физические гаджеты с ИИ упрощают запись и анализ очных встреч: они транскрибируют аудио, создают саммари и списки задач. Обзор включает модели от Plaud, Mobvoi, Comulytic и других — от компактных пластин до носимых подвесок и наушников. Большинство стоят около 150–200 долларов с бонусными минутами транскрипции.
Doist запустила в Todoist функцию Ramble: она превращает голосовые описания в готовые задачи с деталями вроде сроков и приоритетов. ИИ работает на модели Google Gemini 2.5 Flash Live, не хранит аудио и прошла тестирование на 150 тысячах пользователей. Функция доступна всем на разных платформах с поддержкой 38 языков.
Языковые модели ИИ все чаще выдают похожие ответы на творческие задания, формируя "искусственный роевый разум". Ученые предупреждают, что это грозит унификацией человеческой креативности и культуры. Исследование на 25 моделях выявило высокую степень сходства, включая идентичные фразы от разных разработчиков.
Google выпустил TranslateGemma — открытые модели для перевода 55 языков, которые работают на смартфонах, ноутбуках и серверах. Компактная 12B-версия обходит более крупные по качеству благодаря специальному обучению. Модели сохраняют мультимодальность и доступны для скачивания.
Исследователь Anthropic Джош Бэтсон объясняет, почему языковые модели вроде Claude не имеют единого 'я': они используют разные внутренние механизмы для разных фактов, без центральной координации. Это приводит к противоречиям в ответах, но приписывать моделям человеческую coherentность — фундаментальная ошибка. Аналогия с книгой помогает понять природу ИИ.
Cohere анонсировала семейство Tiny Aya — открытые модели с поддержкой 70+ языков, работающие оффлайн на ноутбуках. Есть региональные версии для Африки, Южной Азии и других регионов, обученные на 64 H100. Доступны на Hugging Face и других платформах с планами на технический отчет.
Vertex AI Search позволяет создавать продвинутые поисковые приложения с семантическим пониманием и интеграцией ИИ. Руководство разбирает архитектуру, шаги реализации, оптимизацию и лучшие практики для производства. Это открывает возможности для баз знаний, поддержки и e-commerce.
Рынки криптовалют служат идеальным полигоном для тестирования ИИ-моделей прогнозирования благодаря реал-тайм данным блокчейна и децентрализованным сетям. Нейросети вроде LSTM и гибридные системы анализируют цены, настроения и транзакции, эволюционируя от реактивных ботов к предвидящим агентам. DePIN решает проблемы вычислений, но остаются вызовы с галлюцинациями и масштабированием.
Исследование Apple выявило хрупкость управляемости ИИ: она сильно колеблется в зависимости от модели и задачи. Тесты на языковых моделях и генераторах изображений показали разрывы в калибровке и охвате. Apple поделилась открытым инструментарием для таких проверок.
Большие языковые модели легко обмануть инъекцией промптов, в отличие от людей, которые полагаются на многоуровневый контекст для защиты. LLM путаются в суждениях из-за упрощенного понимания реальности и отсутствия инстинктов. Для ИИ-агентов проблема усугубляется, требуя новых подходов вроде физического воплощения.
Ритейлеры переходят к разговорному ИИ, чтобы быстрее использовать данные о покупателях в решениях. First Insight запустила Ellis — чат-интерфейс для вопросов о ценах, ассортименте и спросе. Такой подход ускоряет процессы и делает аналитику доступной для всех команд.
OpenAI без объявлений представила ChatGPT Translate — сервис для перевода текстов на 25+ языков с простым интерфейсом. Пользователи уточняют переводы запросами, но попадают в основной чатбот, а сервис имеет ограничения и иногда сбивается. Пока полноценный ChatGPT остается лучшим выбором.
Компании могут использовать неструктурированные данные — до 90% всех данных — для мощного ИИ, но требуются правильная подготовка и доработка моделей. Пример Charlotte Hornets показывает, как компьютерное зрение из видео низших лиг помогло найти звезду, ставшую MVP Летней лиги NBA 2025. Ключ к успеху: партнеры с FDE, контекстная калибровка моделей и четкие бизнес-цели.