Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Учёные создали радарную систему с машинным обучением, которая по микродоплеровским сигнатурам взмахов крыльев определяет вид насекомого. На пяти видах опылителей точность составила 85%, а при различении пчёл и ос — 96%. Технология безопасна для насекомых и может помочь в мониторинге опылителей и вредителей.
Архивариусы применяют большие языковые модели для распознавания рукописей в архивах, достигая ошибок ниже 2% против 8% у Transkribus и ускоряя процесс в 50 раз. Исследование Марка Хамфриса на 50 документах 18–19 веков подтверждает превосходство LLM по точности, скорости и стоимости. Archive Pearl и подобные инструменты демократизируют доступ к миллионам оцифрованных страниц.
BioticsAI создала ИИ-копилот для ультразвука, выявляющий аномалии плода, собрала прототип за менее 100 000 долларов и получила одобрение FDA. Компания победила на Startup Battlefield 2023 года и теперь внедряет продукт в больницы. Основатель Робхи Бустами рассказал, как интегрировали регуляторные требования с самого начала и мотивировали команду.
Clarifai удалила 3 миллиона фото от OkCupid, использованных для обучения ИИ распознавания лиц, после расследования FTC. Данные передали в 2014 году вопреки политике конфиденциальности, расследование запустила статья NYT в 2019-м. FTC заключила соглашение с OkCupid и Match Group, запретив misrepresentation данных.
Робот Ace от Sony AI выиграл матчи у профессионалов в настольном теннисе по правилам ITTF, используя симуляцию для обучения. Гуманоид Lightning от Honor первым завершил пекинский полумарафон за 50:26, обогнав олимпийца. Тесты продвигают physical AI для реальных динамичных задач.
Исследователи создали LPM 1.0 — ИИ для генерации видео в реальном времени из одного фото с лип-синком, мимикой и эмоциями, стабильных до 45 минут. Модель различает состояния разговора, работает с фотореализмом, аниме и 3D без дообучения. Пока проект закрыт, без релиза из-за deepfake-рисков.
Zhipu AI представила GLM-5V-Turbo — мультимодальную модель, которая превращает дизайн-макеты в исполняемый фронтенд-код и интегрируется в агенты вроде OpenClaw. Она лидирует в бенчмарках по мультимодальному кодингу и GUI-задачам, сохраняя силу в текстовых тестах. Модель доступна через API по цене $1.20/млн входных и $4/млн выходных токенов.
Фронтирные ИИ-модели уверенно описывают несуществующие изображения в 60–100% случаев, достигая 70–80% баллов бенчмарков без визуала. Текстовая модель на 3 млрд параметров обошла мультимодалки и радиологов, а метод B-Clean выявил утечки в тестах. Это подрывает доверие к визуальным претензиям ИИ и требует новых подходов к оценке.
Новое исследование демонстрирует кольца с ИИ, которые переводят американский и международный жестовые языки в текст с точностью около 88%. Система использует семь колец с акселерометрами, передающих данные по Bluetooth, и может распознавать как отдельные слова, так и предложения.
Planet Labs впервые применила ИИ для распознавания объектов на спутнике Pelican-4, выделив самолёты на аэродроме в Австралии. Технология сократит задержки обработки 30 ТБ ежедневных данных с часов до минут. В планах — сеть Owl для автономного мониторинга и будущие LLM в космосе.
Google Photos анонсировала ИИ-функцию для цифрового гардероба на основе фото одежды из библиотеки. Пользователи смогут фильтровать вещи по категориям, создавать луки, виртуально примерять и сохранять идеи. Запуск на Android летом, на iOS в 'Коллекциях', с конкуренцией от Acloset и других приложений.
Sony AI разработала робота Ace — первого, достигшего экспертного уровня в теннисе стола. В 2025 году он побеждал элитных игроков и профессионалов благодаря девяти камерам, системам зрения и ИИ. Технологии перспективны для производства и сервисной робототехники.
DroneDash Technologies и GEODNET создали GEODASH Aerosystems для производства дронов, опрыскивающих поля без предварительных карт и планов. Аппараты сочетают ИИ-визию с точным позиционированием до 1 см, адаптируются в полете и собирают данные о здоровье растений. Коммерческий запуск намечен на третий квартал 2026 года.
Бенчмарк ProactiveBench показал: из 22 мультимодальных ИИ-моделей почти ни одна не просит помощи при нехватке визуальных данных, предпочитая ошибаться. Дообучение с подкреплением GRPO поднимает точность до 38,6%, но проблема неопределенности остается острой. Исследователи открыли код бенчмарка для дальнейшей работы.
Ring запускает магазин приложений для своих камер, чтобы выйти за рамки домашней охраны с помощью ИИ. Партнеры предлагают решения для ухода за пожилыми, анализа очередей и мониторинга аренды, но запрещены функции вроде распознавания лиц. На старте 15 приложений, комиссия Ring — 10%, цель — сотни в разных сферах.
Naver разработала Seoul World Model — видео-модель на базе 1,2 млн панорам Street View Сеула, которая генерирует реалистичные видео по реальным маршрутам без вымысла. Она решает проблемы с временными объектами, пробелами в данных и накоплением ошибок, обобщаясь на другие города вроде Пусана и Энн-Арбора. Модель превосходит конкурентов и открывает применение в автономном вождении и урбанистике.