Data2Story: 7 ИИ-агентов создают проверяемые статьи из CSV

Data2Story — система из семи ИИ-агентов, автоматически создающая интерактивные мультимодальные статьи из CSV-файлов. Она обеспечивает высокую проверяемость утверждений, связывая каждое с кодом или источником. В тестах с читателями статьи агента получили более высокие оценки, чем написанные людьми.

Трёхчастная диаграмма, показывающая, как ИИ-журналист превращает CSV-датасет о выборе карт в мультимодальный сайт с текстом, интерактивной демонстрацией и графиками через исследование, анализ данных и повествование. — Data2Story преобразует сырой датасет в проверяемую мультимодальную веб-статью, показанную здесь на примере данных о выборе карт 1354 респондентов. | Автор изображения: Lin et al.

Авторы демонстрируют систему на датасете, который пока мало освещался, — расписание Чемпионата мира по футболу 2026 года. На основе расписания и городов‑организаторов система генерирует статью, посвящённую климату, с интерактивной картой.

Около четырёх из десяти матчей запланированы в местах, которые профсоюз игроков FIFPRO классифицирует как зоны экстремально высокого теплового риска, причём основным фактором выступает влажность, а не температура воздуха. Авторы подчёркивают, что это типичные климатические условия, а не прогноз на сам турнир.

Шесть скриншотов трёх автоматически сгенерированных дата‑историй: о Чемпионате мира по футболу 2026 и климате, о публикациях на ArXiv с 1991 по 2026 год и о дневниках использования времени. Каждая история имеет титульное изображение и соответствующую визуализацию данных. — Data2Story создаёт истории из датасетов без участия человека: от климатических данных о стадионах ЧМ до трендов ArXiv и распределения дневного времени. | Автор изображения: Lin et al.

Панель «Инспектор» делает каждое утверждение отслеживаемым

Ключевая особенность системы — панель «Инспектор», показывающая структурированные доказательства для каждого предложения и элемента. Каждое аннотированное предложение, график и интерактивный элемент получает собственную карточку, в которой отображается либо точная строка кода (вместе с файлом данных), либо внешняя ссылка, подтверждающая утверждение.

Скриншот сгенерированной статьи об игральных картах, где утверждения связаны стрелками с двумя типами доказательств: внешняя ссылка и скрипт на Python, воспроизводящий значение 20,1 процента. — Инспектор связывает каждое утверждение либо с внешним источником, либо с исполняемым скриптом, который заново вычисляет показатель из данных. | Автор изображения: Lin et al.

Это позволяет проверить происхождение 93% всех видимых утверждений. Исследователи подчёркивают, что это не гарантирует их корректность, а лишь возможность верификации. Сомневаетесь в цифре? Запустите код. Для сравнения, у статей, написанных людьми, этот показатель составляет 25%, отчасти потому, что журналисты редко публикуют аналитический код. Разрыв отражает как пробел в журналистской практике, так и преимущество системы, утверждают исследователи.

Семь агентов и единый редакционный процесс

За каждой статьёй стоит цепочка из семи специализированных агентов, которую команда называет «виртуальной редакцией». «Детектив» занимается поиском контекста в интернете, поскольку одной таблицы редко бывает достаточно. Для данных о Чемпионате мира он связывает города‑организаторы с рейтингами теплового риска FIFPRO и климатическими данными Open-Meteo.

«Аналитик» выполняет код, вместо того чтобы угадывать числа. «Редактор» выбирает, какие находки станут основой повествования. «Дизайнер» подбирает подходящий формат — например, карту для географии или аудиоклип для музыки. «Программист» собирает HTML-страницу, «Аудитор» проверяет вёрстку на ошибки, а «Инспектор» связывает всё с источниками.

Схема конвейера виртуальной редакции с ролями: Детектив, Аналитик, Редактор, Дизайнер, Программист и Аудитор, которые последовательно обрабатывают данные, превращая их в готовую HTML-статью; Инспектор связывает все промежуточные результаты с финальным материалом. — Каждый агент в виртуальной редакции Data2Story выполняет один шаг от исследования до вёрстки. Инспектор связывает каждое утверждение с его источником. | Автор изображения: Lin et al.

Базовая модель — Claude Opus 4.7, работающая в Claude Code. Для изображений, видео и аудио система использует модели через OpenRouter, такие как gpt-5.4-image-2, seedance-2.0 и lyria-3-pro-preview.

53 читателя оценили статьи агента выше, чем оригиналы людей

Исследователи подобрали 18 публичных датасетов и сопоставили их с созданными людьми оригиналами из трёх источников: лаконичные брифинги The Economist, богато оформленные лонгриды The Pudding и датасеты сообщества TidyTuesday. 53 приглашённых читателя оценили обе версии по пяти критериям: визуальный дизайн, ритм повествования, прозрачность данных, проверяемость утверждений и полезность инсайтов.

Data2Story выиграла по всем пяти категориям. Наибольший отрыв был в прозрачности: +1,49 по семибалльной шкале. В целом 74% предпочли статью агента, 25% — человеческую версию, а 2% назвали ничью.

При разбивке по источникам картина меняется. Агент очевидно выиграл у The Pudding и TidyTuesday, но с The Economist отрыв оказался менее заметным.

Гистограммы, сравнивающие статьи агента и человека по 18 парам. Агент пишет больше, но более короткими предложениями (82,2 против 56,6 предложений и 16,0 против 20,9 слов на предложение) и покрывает 50,4% перспективы человека, тогда как обратное покрытие составляет лишь 35,1%. — По 18 парам статей Data2Story охватывает примерно половину ракурса человека, в то время как журналисты улавливают лишь треть точек зрения агента, особенно резко это проявляется в материалах The Economist. | Автор изображения: Lin et al.

Когда измеряли, какие утверждения из написанной человеком статьи также встречаются в статье агента, Data2Story покрывает около половины. И наоборот, только 35% утверждений агента присутствуют в тексте человека.

Агент добавляет множество собственных ракурсов, но лишь частично улавливает редакционную суть. Разрыв особенно велик в коротких шаблонных брифингах Economist, где агент воспроизводит 73% выводов человека, вероятно потому, что эти тексты близко следуют стандартным статистикам, которые агент и так вычисляет.

Где люди всё ещё выигрывают

Исследователи выделяют три области, в которых авторы‑люди остаются впереди. Что касается редакционной перспективы, репортёры объясняют то, что не могут показать данные. Отчёт о Repair Cafe связывает низкий уровень ремонта с тем, что производители телефонов, автомобилей и тракторов намеренно блокируют доступ к диагностическим инструментам и запчастям. Это теория, основанная на реальных репортажах, а не на данных. Агент показывает, что ломается, но «почему» остаётся за кадром.

Сравнение двух версий статьи о Repair Cafe. Человеческий отчёт сверху включает пояснительный текст о праве на ремонт, а версия агента снизу показывает столбчатую диаграмму частоты ремонта по двадцати ведущим типам продуктов. — Человеческий отчёт объясняет, почему ремонт не удаётся. Data2Story лишь строит график частоты ремонта по типам продуктов. | Автор изображения: Lin et al.

В творческом дизайне материал The Pudding о стендап‑комедии превращает полную расшифровку шоу Али Вонг в пользовательский интерфейс. Рядом с каждой репликой расположен кружок, размер которого соответствует длине смеха. Для того же контента агент просто вставляет статичную миниатюру с YouTube.

Сравнение двух версий статьи о стендап-шоу. Человеческий отчёт Pudding сверху использует полную расшифровку как интерфейс, а версия агента снизу показывает статичную миниатюру Netflix и кнопку воспроизведения. — Команда The Pudding превращает весь текст в интерфейс. Data2Story встраивает кликабельную миниатюру. | Автор изображения: Lin et al.

В сложных единых графиках визуализация Economist о космической гонке объединяет государственных и коммерческих провайдеров, показатели успешности и аннотации в одно изображение. Агент же разбрасывает те же данные по нескольким графикам, и главная мысль теряется.

Сравнение двух визуализаций космической гонки. Плотно аннотированный график The Economist сверху показывает государственных и коммерческих провайдеров запусков в одном изображении, а интерактивная версия агента снизу использует ползунок по годам и только количество запусков без аннотаций. — The Economist упаковывает государственные и коммерческие запуски, а также аннотации в одну графику. Data2Story распределяет данные по интерактивному представлению без примечаний. | Автор изображения: Lin et al.

Сотрудник, а не замена

Авторы позиционируют Data2Story как инструмент для редакций. Люди привносят перспективу и репортаж, а агенты берут на себя вычисления, графику и машинную проверяемость источников.

Наибольшую пользу система может принести в темах, которые редакции не могут освещать из‑за нехватки ресурсов, — нишевые датасеты, которые иначе никогда не стали бы читаемой историей. Одно из ограничений — Data2Story пока работает полностью на автопилоте. Версия с участием человека в цикле обратной связи оставлена для будущих работ. Сайт доступен по адресу data2story.github.io, а код — на GitHub.

Машинная проверяемость — именно та область, где современные ИИ‑системы часто спотыкаются. Недавний бенчмарк Пекинского университета показал, что ведущие модели нередко дают правильный ответ при анализе документов, но ссылаются на неверные источники; эту проблему исследователи называют «атрибуционной галлюцинацией».

Другое исследование предполагает, что ИИ‑поисковые агенты часто не исследуют, а в основном подтверждают то, что уже знают из обучения. Data2Story пытается закрыть этот пробел, заставляя аналитика вычислять показатели с помощью исполняемого кода, а не догадок, и связывая каждое утверждение с источником через Инспектора. Perplexity применяет похожий подход с «Search as Code», где модели сами пишут поисковые запросы вместо вызова чёрного ящика API.

Data2Story: как 7 ИИ-агентов создают статьи из CSV

Панель «Инспектор» делает каждое утверждение отслеживаемым

Семь агентов и единый редакционный процесс

53 читателя оценили статьи агента выше, чем оригиналы людей

Где люди всё ещё выигрывают

Сотрудник, а не замена

Горячее

Seedance 2.5 от ByteDance: ИИ-видео до 30 секунд без склеек

Adobe добавила ИИ-агентов в Photoshop Premiere

Subquadratic утверждает, что решила ключевую проблему больших языковых моделей

Всё больше людей узнают новости от ИИ-чатботов, но доверие остаётся низким

Microsoft и Chevron строят гигантский газовый дата-центр

Сейчас в тренде