Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Исследование анализирует критику разработчиков «ИИ-шлака» как трагедии общин: личные выгоды от ИИ приводят к техдолгу, выгоранию ревьюеров и потере доверия в сообществе. Выявлены 15 категорий жалоб из 1154 постов на Reddit и HN. Предложены меры для инструментов, команд и образования.
Институт Ai2 представил модели роботов MolmoSpaces и MolmoBot, обученные исключительно в симуляции для zero-shot переноса на реальные устройства. MolmoSpaces содержит 230 000 сцен, 130 000 объектов и 42 миллиона аннотаций захватов. Это убирает нужду в месяцах реальных демонстраций и ускоряет разработку.
Специалисты из Apple, Stanford и Вашингтонского университета обнаружили, что экстракторы HTML вроде Resiliparse, Trafilatura и JusText пропускают разные участки веба — общие всего 39% страниц. Их объединение увеличивает токены на 71%, радикально улучшая таблицы и код. Это заставит пересмотреть подготовку данных для ИИ-моделей.
Исследование Anthropic показало: ИИ-помощники мешают глубокому пониманию новой библиотеки Trio, снижая результаты теста на 17%. Качество обучения зависит от стиля работы с ИИ — простая генерация кода дает худшие итоги, а вопросы и объяснения сохраняют знания. Ошибки без ИИ помогают лучше разобраться в концепциях.
Масштабное исследование показывает: проблемы с занятостью в профессиях, уязвимых к ИИ, начались в начале 2022 года, до ChatGPT. Выпускники с навыками вроде программирования и письма все равно востребованы. Запуск чат-бота нельзя считать ключевым фактором спада — важнее макроэкономика.
Ученые Anthropic выявили «ось помощника» в ИИ-моделях: ролевые промты легко сдвигают чат-боты от полезной роли к мистическим образам. Философские и терапевтические темы усиливают дрейф, что рискованно. Метод activation capping снижает вред на 60%, помогая стабилизировать поведение.
Большие языковые модели способны симулировать окружения для обучения ИИ-агентов, преодолевая ограничения реального опыта. Исследование на пяти текстовых средах показало высокую точность после дообучения, особенно в структурированных задачах. Результаты поддерживают идею перехода к обучению на синтетическом опыте.
Швейцарский математик Йоханнес Шмитт сообщает, что GPT-5 самостоятельно решил открытую проблему в алгебраической геометрии. В статье он четко указал вклад разных ИИ-моделей и разметил каждый абзац. Такой подход подчеркивает важность прозрачности, но вызывает сомнения в удобстве.
Работа вводит фреймворк JIT для моделирования мира на лету, повторяя человеческие симуляции в планировании через симуляцию, поиск и обновление моделей. Тесты в навигации и предсказаниях физики подтвердили эффективность при минимальном использовании памяти. Дальше — динамичные сценарии для ИИ.
Ученые ETH Zurich и Anthropic разработали метод, где ИИ за 1-4 доллара и минуты связывает псевдонимы с реальными людьми по постам на форумах. Тесты на Hacker News дали 66% успеха из 338 профилей, на Reddit и интервью — схожие результаты при низких ложных срабатываниях. Защиты слабы, угрозы для анонимности велики.
Китайская Kling выпустила видео-модель 3.0 с улучшениями в стабильности видео, аудио и генерации 4K-изображений. Это универсальный инструмент для творчества с клипами до 15 секунд и многосценными съёмками. Ранний доступ открыт для Ultra-подписчиков, а обзор уже есть на YouTube.
OpenAI представила Prism — облачный инструмент на GPT-5.2 для научной работы. Он сочетает LaTeX-редактор, поиск литературы и ИИ-помощника с поддержкой совместного редактирования. Доступен бесплатно всем пользователям ChatGPT.
Команда Microsoft и Tsinghua разработала 7B-модель X-Coder для программирования, обученную исключительно на синтетических данных SynthSmith, которая превосходит 14B-конкурентов на бенчмарках LiveCodeBench. Разнообразие задач оказалось ключевым фактором успеха, а синтетика снизила риск контаминации. Код доступен на GitHub, веса модели выйдут скоро.
SnapGen++ от Snap Inc. генерирует изображения 1024×1024 за 1,8 секунды на iPhone 16 Pro Max благодаря диффузионному трансформеру с 0,4 млрд параметров. Модель превосходит крупные аналоги вроде Flux.1-dev и использует инновации вроде Elastic Training и K-DMD для мобильной эффективности. Это первый шаг к серверному качеству ИИ-изображений на смартфонах.
Исследователи из MIT изучили 59 научных моделей ИИ и нашли, что они независимо от данных и архитектур формируют похожие внутренние представления молекул, материалов и белков. Чем лучше модель работает, тем ближе её картина к лидерам, но все они слабы на новых структурах. Это намекает на универсальную модель вещества, хотя до фундаментальных систем ещё далеко.
Корейский стартап Motif Technologies представил модель Motif-2-12.7B-Reasoning и white paper с практическими уроками по обучению корпоративных LLM. Документ разбирает источники способностей к рассуждениям, проблемы длинного контекста, RL и оптимизации памяти. Эти советы помогут избежать типичных ошибок в бизнес-проектах.