arxiv

25 публикаций по теме

arxiv

OpenAI научилась предсказывать сбои ИИ до релиза

Исследователи OpenAI разработали метод «Симуляция развёртывания», который на основе реальных пользовательских диалогов предсказывает частоту сбоев будущей модели. В тестах на GPT-5 метод с точностью 92% предсказал динамику проблем, тогда как стандартные тесты — лишь 54%. Подход также обнаружил новое нежелательное поведение, названное Calculator Hacking.

2 мин

17 июня 2026 г.

Новости

Исследование: «ИИ-шлак» как трагедия общин в разработке

Исследование анализирует критику разработчиков «ИИ-шлака» как трагедии общин: личные выгоды от ИИ приводят к техдолгу, выгоранию ревьюеров и потере доверия в сообществе. Выявлены 15 категорий жалоб из 1154 постов на Reddit и HN. Предложены меры для инструментов, команд и образования.

8 мин

5 апреля 2026 г.

Новости

Ai2 представила роботов, обученных только в симуляции

Институт Ai2 представил модели роботов MolmoSpaces и MolmoBot, обученные исключительно в симуляции для zero-shot переноса на реальные устройства. MolmoSpaces содержит 230 000 сцен, 130 000 объектов и 42 миллиона аннотаций захватов. Это убирает нужду в месяцах реальных демонстраций и ускоряет разработку.

1 мин

14 марта 2026 г.

Новости

Обучение моделей ИИ упускает огромные части интернета

Специалисты из Apple, Stanford и Вашингтонского университета обнаружили, что экстракторы HTML вроде Resiliparse, Trafilatura и JusText пропускают разные участки веба — общие всего 39% страниц. Их объединение увеличивает токены на 71%, радикально улучшая таблицы и код. Это заставит пересмотреть подготовку данных для ИИ-моделей.

4 мин

28 февраля 2026 г.

Новости

ИИ мешает учить кодинг без вопросов 'почему'

Исследование Anthropic показало: ИИ-помощники мешают глубокому пониманию новой библиотеки Trio, снижая результаты теста на 17%. Качество обучения зависит от стиля работы с ИИ — простая генерация кода дает худшие итоги, а вопросы и объяснения сохраняют знания. Ошибки без ИИ помогают лучше разобраться в концепциях.

5 мин

31 января 2026 г.

Новости

ChatGPT не вызвал спад на рынке труда

Масштабное исследование показывает: проблемы с занятостью в профессиях, уязвимых к ИИ, начались в начале 2022 года, до ChatGPT. Выпускники с навыками вроде программирования и письма все равно востребованы. Запуск чат-бота нельзя считать ключевым фактором спада — важнее макроэкономика.

5 мин

25 января 2026 г.

Новости

Ролевые промты выводят ИИ из роли помощника

Ученые Anthropic выявили «ось помощника» в ИИ-моделях: ролевые промты легко сдвигают чат-боты от полезной роли к мистическим образам. Философские и терапевтические темы усиливают дрейф, что рискованно. Метод activation capping снижает вред на 60%, помогая стабилизировать поведение.

4 мин

20 января 2026 г.

Новости

LLM могут стать моделями мира для ИИ-агентов

Большие языковые модели способны симулировать окружения для обучения ИИ-агентов, преодолевая ограничения реального опыта. Исследование на пяти текстовых средах показало высокую точность после дообучения, особенно в структурированных задачах. Результаты поддерживают идею перехода к обучению на синтетическом опыте.

4 мин

1 января 2026 г.

Новости

ИИ-агент спроектировал ядро RISC-V CPU с нуля

Стартап Verkor.io применил ИИ-агента Design Conductor для автономного создания ядра RISC-V процессора VerCore на 1,48 ГГц с результатом CoreMark 3261, как у Intel Celeron SU2300 2011 года. Дизайн занял 12 часов от промпта до GDSII-файла, это первое полное ядро от ИИ. Файлы опубликуют в апреле, с демонстрацией на FPGA.

6 мин

24 апреля 2026 г.

Новости

Моделирование мира «just in time» помогает планировать и мыслить

Работа вводит фреймворк JIT для моделирования мира на лету, повторяя человеческие симуляции в планировании через симуляцию, поиск и обновление моделей. Тесты в навигации и предсказаниях физики подтвердили эффективность при минимальном использовании памяти. Дальше — динамичные сценарии для ИИ.

5 мин

2 апреля 2026 г.

Новости

ИИ разоблачает псевдонимы в сети за минуты и доллары

Ученые ETH Zurich и Anthropic разработали метод, где ИИ за 1-4 доллара и минуты связывает псевдонимы с реальными людьми по постам на форумах. Тесты на Hacker News дали 66% успеха из 338 профилей, на Reddit и интервью — схожие результаты при низких ложных срабатываниях. Защиты слабы, угрозы для анонимности велики.

4 мин

1 марта 2026 г.

Новости

Kling 3.0: шаг к реальным ИИ-видео

Китайская Kling выпустила видео-модель 3.0 с улучшениями в стабильности видео, аудио и генерации 4K-изображений. Это универсальный инструмент для творчества с клипами до 15 секунд и многосценными съёмками. Ранний доступ открыт для Ultra-подписчиков, а обзор уже есть на YouTube.

1 мин

4 февраля 2026 г.

Новости

Prism от OpenAI: LaTeX, ссылки и GPT-5.2 вместе

OpenAI представила Prism — облачный инструмент на GPT-5.2 для научной работы. Он сочетает LaTeX-редактор, поиск литературы и ИИ-помощника с поддержкой совместного редактирования. Доступен бесплатно всем пользователям ChatGPT.

1 мин

28 января 2026 г.

Новости

7B-модель кода от Microsoft-Tsinghua обходит 14B-аналоги

Команда Microsoft и Tsinghua разработала 7B-модель X-Coder для программирования, обученную исключительно на синтетических данных SynthSmith, которая превосходит 14B-конкурентов на бенчмарках LiveCodeBench. Разнообразие задач оказалось ключевым фактором успеха, а синтетика снизила риск контаминации. Код доступен на GitHub, веса модели выйдут скоро.

5 мин

25 января 2026 г.

Новости

SnapGen++: ИИ-изображения на iPhone за 1,8 секунды

SnapGen++ от Snap Inc. генерирует изображения 1024×1024 за 1,8 секунды на iPhone 16 Pro Max благодаря диффузионному трансформеру с 0,4 млрд параметров. Модель превосходит крупные аналоги вроде Flux.1-dev и использует инновации вроде Elastic Training и K-DMD для мобильной эффективности. Это первый шаг к серверному качеству ИИ-изображений на смартфонах.

3 мин

18 января 2026 г.

Новости

ИИ-модели сходятся в представлении вещества

Исследователи из MIT изучили 59 научных моделей ИИ и нашли, что они независимо от данных и архитектур формируют похожие внутренние представления молекул, материалов и белков. Чем лучше модель работает, тем ближе её картина к лидерам, но все они слабы на новых структурах. Это намекает на универсальную модель вещества, хотя до фундаментальных систем ещё далеко.

3 мин

30 декабря 2025 г.

arxiv

OpenAI научилась предсказывать сбои ИИ до релиза

Исследование: «ИИ-шлак» как трагедия общин в разработке

Ai2 представила роботов, обученных только в симуляции

Обучение моделей ИИ упускает огромные части интернета

ИИ мешает учить кодинг без вопросов 'почему'

ChatGPT не вызвал спад на рынке труда

Ролевые промты выводят ИИ из роли помощника

LLM могут стать моделями мира для ИИ-агентов

ИИ-агент спроектировал ядро RISC-V CPU с нуля

Моделирование мира «just in time» помогает планировать и мыслить

ИИ разоблачает псевдонимы в сети за минуты и доллары

Kling 3.0: шаг к реальным ИИ-видео

Prism от OpenAI: LaTeX, ссылки и GPT-5.2 вместе

7B-модель кода от Microsoft-Tsinghua обходит 14B-аналоги

SnapGen++: ИИ-изображения на iPhone за 1,8 секунды

ИИ-модели сходятся в представлении вещества

Сейчас в тренде

Популярные темы