Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
X начала глобальный запуск автоперевода постов на моделях Grok для большего охвата аудитории. В iOS-приложении появился ИИ-фоторедактор с инструментами размытия, рисования и редактированием по текстовым запросам. Обновления скоро выйдут на Android, хотя доступ для платных пользователей пока под вопросом.
Amazon расширил Alexa+ возможностью заказа еды из Uber Eats и Grubhub в разговорном стиле с мгновенными правками. Функция доступна на Echo Show 8+, синхронизирует прошлые заказы и подводит итоги. Это развитие идёт на фоне трудностей ИИ в фастфуде у McDonald’s и Taco Bell, а ассистент обзавёлся новыми стилями общения.
Инженерия промптов уступает место инженерии концепций, где взаимодействия строятся вокруг четких контрактов, модулей и метрик вместо хрупких строк. Подход упрощает разработку надежных ИИ-систем с использованием DSPy, структурированных выходов OpenAI и исследований вроде PaCE. Практические шаги и примеры показывают, как перейти без полной перестройки.
Grammarly ввела Expert Review — инструмент для правок текстов от лица известных авторов и журналистов на основе их публичных работ. Ни один эксперт не участвует в процессе и не давал согласия на использование имени. Специалист подчеркивает отсутствие настоящих экспертов в создании рекомендаций.
Команда Philippe Laban протестировала frontier LLM на шести задачах в формате длинных разговоров: модели начиная с GPT-5 теряют до 33% точности. Улучшения есть, но минимальные — в Python-задачах спад всего 10–20%, а реальные сценарии могут усугубить проблему. Помогает только перезапуск чата с предварительным саммари запросов.
Индийская лаборатория Sarvam выпустила модели ИИ с 30 и 105 миллиардами параметров, рассчитывая на успех открытых решений против гигантов. Новинки обучены с нуля на огромных объемах данных индийских языков и предназначены для голосовых ассистентов и чатов. Компания фокусируется на практических задачах и планирует open-source публикацию.
Anthropic открывает офис в Бангалоре и анонсирует партнёрства в бизнесе, образовании и агросекторе Индии. Компания улучшает модели для индийских языков, помогает стартапам и НПО внедрять Claude. Индия — второй рынок платформы с сильным фокусом на технические задачи.
Большие языковые модели вроде GPT-4 уже переводят на уровне начинающих и средних специалистов, уступая лишь экспертам с 10+ годами опыта. Исследование показало различия в ошибках: модели бывают слишком буквальными, а люди — излишне interpretive. Модели с сильным мышлением приближаются к топ-уровню.
Отчет DeepL Borderless Business выявил: 83% предприятий не используют современный языковой ИИ для переводов, хотя ИИ внедряют везде. Объем контента вырос на 50% с 2023 года, но процессы устарели, что тормозит продажи, поддержку и расширение. DeepL продвигает агенты с фокусом на безопасность и суверенитет данных.
Физические ИИ-устройства вроде Plaud Note, Mobvoi TicNote и других записывают очные встречи, транскрибируют речь и создают саммари. Они компактны, носимы или размером с карту, многие без обязательных подписок. Модели различаются по микрофонам, автономности и бесплатным минутам транскрипции.
Grammarly в функции Expert Review использует имена экспертов вроде Стивена Кинга, Нила деГрасса Тайсона и Нилэя Пателя без их согласия, включая даже умерших авторов. После критики компания предложила только opt-out по email. Некоторые ссылки ведут на спам, а рекомендации выглядят как настоящие отзывы.
Ученые из Университета Сапиенца разработали метод spilled energy для обнаружения галлюцинаций в больших языковых моделях без дообучения. Он фиксирует несоответствия в энергии softmax-слоя, которые растут при ошибках. На девяти бенчмарках AuROC достигает 77 процентов, превосходя обученные детекторы и обобщаясь на новые задачи.
Wispr Flow запустила Android-приложение для ИИ-диктовки с плавающим пузырем для голосового ввода. Оно стало быстрее на 30%, поддерживает 100+ языков и Hinglish, а пользователи уже наговорили 1,3 млн слов. Стартап привлек 81 млн долларов инвестиций при оценке в 700 млн.
Cohere анонсировала семейство Tiny Aya — открытые модели с поддержкой 70+ языков, работающие оффлайн на ноутбуках. Есть региональные версии для Африки, Южной Азии и других регионов, обученные на 64 H100. Доступны на Hugging Face и других платформах с планами на технический отчет.
Vertex AI Search позволяет создавать продвинутые поисковые приложения с семантическим пониманием и интеграцией ИИ. Руководство разбирает архитектуру, шаги реализации, оптимизацию и лучшие практики для производства. Это открывает возможности для баз знаний, поддержки и e-commerce.
Рынки криптовалют служат идеальным полигоном для тестирования ИИ-моделей прогнозирования благодаря реал-тайм данным блокчейна и децентрализованным сетям. Нейросети вроде LSTM и гибридные системы анализируют цены, настроения и транзакции, эволюционируя от реактивных ботов к предвидящим агентам. DePIN решает проблемы вычислений, но остаются вызовы с галлюцинациями и масштабированием.