Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Архивариусы применяют большие языковые модели для распознавания рукописей в архивах, достигая ошибок ниже 2% против 8% у Transkribus и ускоряя процесс в 50 раз. Исследование Марка Хамфриса на 50 документах 18–19 веков подтверждает превосходство LLM по точности, скорости и стоимости. Archive Pearl и подобные инструменты демократизируют доступ к миллионам оцифрованных страниц.
Ученые MIT объяснили надежность законов масштабирования языковых моделей через суперпозицию — перекрытие векторов понятий в ограниченном пространстве. Реальные модели вроде OPT и GPT-2 работают в режиме сильной суперпозиции, где ошибка падает пропорционально ширине. Это предсказывает пределы роста и усложняет интерпретируемость.
Tencent опубликовала открытую модель ИИ Hy-MT1.5-1.8B-1.25bit объемом 440 МБ для оффлайн-перевода 33 языков на смартфонах. Она конкурирует с Google Translate и крупными моделями вроде Qwen3-32B благодаря сжатию до 1,25 бита на параметр без потери качества. Доступно демо-приложение для Android и 30 побед в конкурсах.
Гайд по настройке локальной транскрипции аудио с Faster-Whisper, которая в 4 раза быстрее оригинального Whisper и тратит меньше памяти. Описаны установка на CPU/GPU, предобработка файлов pydub+FFmpeg и готовые скрипты для MP3 в текст. Система работает оффлайн, защищая приватность.
К середине 2025 года 35% новых сайтов содержат ИИ-текст, что приводит к семантическому сжатию на 33% и росту позитива на 107%, но не увеличивает фактических ошибок. Общественное мнение преувеличивает негатив, а реальные риски — в апатии к информации и коллапсе моделей. Авторы предлагают стандарты C2PA и улучшение алгоритмов.
Nothing представила Essential Voice — ИИ-инструмент для голосового ввода текста в любом приложении смартфона. Он удаляет слова-паразиты, поддерживает кастомные шорткаты и перевод на 100+ языков, стартовав на Phone (3). Функция ускоряет набор в четыре раза по сравнению с печатью.
Статья разбирает 7 шагов для перехода от локального прототипа языковых моделей к стабильной продакшен-системе. От фиксации задачи и выбора модели до защиты, оптимизации и постоянных улучшений по реальным данным. Подход решает проблемы с задержками, расходами и неожиданными сценариями использования.
Отчет DeepL Borderless Business выявил: 83% предприятий не используют современный языковой ИИ для переводов, хотя ИИ внедряют везде. Объем контента вырос на 50% с 2023 года, но процессы устарели, что тормозит продажи, поддержку и расширение. DeepL продвигает агенты с фокусом на безопасность и суверенитет данных.
Формулировка «не просто это — это то» стала маркером ИИ-текстов и взлетела в корпоративных материалах более чем в 4 раза — с 50 до 200+ упоминаний с 2023 по 2025 год по данным AlphaSense. Примеры есть у Cisco, Accenture, McKinsey и Microsoft. CEO Pangram подтверждает: это признак растущей зависимости бизнеса от моделей.
Рейтинг лучших приложений для диктовки речи на базе ИИ после тестирования: Wispr Flow с кастомными стилями, Willow с фокусом на приватность, Superwhisper для файлов. Каждое предлагает уникальные функции вроде низкой задержки, оффлайн-работы или больших бесплатных лимитов, цены от бесплатных до пожизненных лицензий.
Google Translate к 20-летию запустил практику произношения с оценкой речи и советами. Функция работает на английском, испанском и хинди в США и Индии, похожа на Duolingo. Недавно расширили перевод через наушники на iOS и ряд стран для Android.
Энкодеры — основа понимания ИИ, эволюционировавшие от ручного преобразования данных к мультимодальным системам для текста и изображений. Они решают задачи в рекомендациях, медицине, шопинге и мошенничестве. Дальше ждут оптимизация, персонализация и этические улучшения.
Собраны семь нестандартных сценариев для больших языковых моделей за пределами чатов: от роли критика решений и разбора ошибок до анализа договоров и персональных планов. Каждый пример подкреплен готовым промтом. Успех достигается через точные инструкции с ролями, ограничениями и целями.
Локальный инструмент на Whisper, RoBERTa и BERTopic транскрибирует клиентские звонки, определяет настроение, эмоции и темы. Работает оффлайн с дашбордом на Streamlit для визуализации. Идеально для анализа поддержки без утечек данных.
X начала глобальный запуск автоперевода постов на моделях Grok для большего охвата аудитории. В iOS-приложении появился ИИ-фоторедактор с инструментами размытия, рисования и редактированием по текстовым запросам. Обновления скоро выйдут на Android, хотя доступ для платных пользователей пока под вопросом.
Amazon расширил Alexa+ возможностью заказа еды из Uber Eats и Grubhub в разговорном стиле с мгновенными правками. Функция доступна на Echo Show 8+, синхронизирует прошлые заказы и подводит итоги. Это развитие идёт на фоне трудностей ИИ в фастфуде у McDonald’s и Taco Bell, а ассистент обзавёлся новыми стилями общения.