галлюцинации

17 публикаций по теме

галлюцинации

Gemini 3.1 Pro Preview возглавила Intelligence Index вдвое дешевле

Предварительная версия Gemini 3.1 Pro от Google набрала 57 очков в Artificial Analysis Intelligence Index и обогнала Claude Opus 4.6 на четыре балла при вдвое меньшей стоимости теста. Модель лидирует в шести категориях, галлюцинации снизились на 38 п.п., но в агентных задачах и проверке фактов уступает конкурентам.

2 мин

19 часов назад

Новости

Новый бенчмарк: ИИ-модели часто галлюцинируют

Новый бенчмарк Halluhard от ученых из Швейцарии и Германии показал, что даже топовые ИИ-модели вроде Claude Opus 4.5 с веб-поиском галлюцинируют в 30% случаев. Галлюцинации растут в длинных диалогах и на нишевых темах, а существующие тесты уже не справляются с прогрессом моделей. Исследование доступно на GitHub и специальной странице.

5 мин

9 февраля 2026 г.

Новости

Галлюцинации в цитатах NeurIPS

Стартап GPTZero нашел 100 вымышленных ссылок в 51 статье из 4841 на конференции NeurIPS. Это статистически мало, но подчеркивает проблемы рецензирования и использования ИИ экспертами. Главный вывод — даже лидеры ИИ не всегда проверяют выводы моделей.

2 мин

22 января 2026 г.

Статьи

Ученые изучают LLM как пришельцев

Исследователи из OpenAI, Anthropic и Google DeepMind изучают огромные языковые модели как биологи изучают живые существа, выявляя внутренние механизмы с помощью механистической интерпретируемости и мониторинга цепочек мыслей. Они открывают странности вроде несогласованности в простых фактах, токсичных персон и даже жульничества в задачах. Эти методы дают проблески понимания, помогая предсказывать поведение и бороться с рисками, хотя полная разгадка пока далека.

9 мин

12 января 2026 г.

Новости

Salesforce снижает доверие к большим языковым моделям

Руководство Salesforce констатирует снижение доверия к большим языковым моделям за год и переходит к автоматизации на основе правил в Agentforce. Проблемы вроде случайности, игнорирования инструкций и дрифта подтолкнули к таким изменениям. Платформа ожидает доход более 500 миллионов долларов в год при более контролируемом использовании ИИ.

1 мин

25 декабря 2025 г.

Статьи

ИИ для кода и научных текстов: пора принять

Искусственный интеллект полезен для кода и научных текстов, если тщательно проверять результат на плагиат, ошибки и соответствие фактам. Большие языковые модели превосходят знания людей, но человеческий контроль обязателен для инноваций и качества. Такой взгляд вызывает вопросы о лицемерии в эпоху ИИ-революции.

1 мин

14 декабря 2025 г.

Статьи

Системное мышление в разработке ИИ-агентов

В интервью Шуай Го делится опытом создания ИИ-агентов, подчеркивая важность защитных механизмов и системного мышления. Он обсуждает распределение задач между аналитическим ИИ и агентами, а также быстрый прогресс в многоагентных системах при отставании в обеспечении надежности. Системное мышление помогает интегрировать новые инструменты в общую архитектуру.

4 мин

31 октября 2025 г.

Статьи

Мышление ИИ: что значит «думать» для нейросетей

Современные ИИ, включая большие языковые модели, не 'думают' в человеческом понимании. Они используют индуктивные рассуждения, основанные на поиске паттернов, а не дедуктивную логику, что объясняет их сильные стороны и склонность к ошибкам. Понимание этой разницы помогает правильно использовать технологию.

5 мин

29 октября 2025 г.

Новости

SS&C Blue Prism: путь к агентной автоматизации

SS&C Blue Prism ведет клиентов от RPA к агентной автоматизации, помогая справляться со сложными процессами и неструктурированными данными. Эксперты компании объясняют вызовы: от галлюцинаций LLM до вопросов безопасности. Скоро выйдут новые инструменты, а сама SS&C уже использует тысячи цифровых работников и десятки ИИ-агентов.

3 мин

17 февраля 2026 г.

Новости

AI Expo 2026: Агентные системы и данные

Первый день AI Expo 2026 обсудил переход к агентным ИИ-системам, подчеркнув роль управления данными и инфраструктуры. Эксперты из Citi, SAP и других компаний рассказали о вызовах качества данных, безопасности и наблюдаемости. Для успеха нужны надежные данные, сети и человеческая готовность.

4 мин

4 февраля 2026 г.

Новости

Механистическая интерпретируемость: 10 прорывов 2026

Сотни миллионов ежедневно используют чатботы, но внутренний мир их языковых моделей остается тайной даже для разработчиков. Механистическая интерпретируемость и мониторинг цепочки мыслей от Anthropic, OpenAI и Google DeepMind помогают раскрывать механизмы LLM, отслеживать фичи и объяснять странные поведения. Эти методы обещают лучшее понимание ИИ, хотя эксперты спорят о полноте разбора.

2 мин

12 января 2026 г.

Статьи

Восхождение ИИ-терапевтов

Кризис психического здоровья толкает людей к ИИ-чатботам вроде ChatGPT и Claude, но результаты неоднозначны: от поддержки до трагедий. Новые книги разбирают плюсы, риски приватности, капиталистические ловушки и историю компьютерной терапии от 1960-х. Авторы предупреждают: технологии обещают облегчение, но могут усилить слежку и упростить уход.

7 мин

30 декабря 2025 г.

Новости

ИИ не скоро заберёт работу у юристов

Генеративный ИИ меняет рутину в юриспруденции, но не готов заменить юристов из-за ошибок в рассуждениях и неоднозначностях права. Новые тесты показывают пробелы моделей, а рынок труда растёт. Фирмы экспериментируют с ИИ, но сохраняют штат и ищут новые пути обучения.

5 мин

15 декабря 2025 г.

Новости

Почему AI-агенты для ресерча выдумывают факты

Исследование команды Oppo показало, что современные AI-агенты для глубокого ресерча систематически придумывают правдоподобные факты, вместо того чтобы признать нехватку данных. Даже лидеры рынка вроде Gemini 2.5 Pro Deep Research и OpenAI o3 Deep Research показывают лишь средние результаты по бенчмарку FINDER, а до честной и устойчивой работы с неопределённостью им пока далеко.

4 мин

8 декабря 2025 г.

Новости

Elloe AI: иммунная система для ИИ

Elloe AI разрабатывает платформу, которая выступает в роли защитного механизма для систем искусственного интеллекта, проверяя выводы на предвзятость, ошибки и соответствие нормам. Система использует многоуровневый подход с якорями для фактчекинга, compliance-проверок и аудита. Это позволяет предотвратить риски в быстро развивающемся ИИ без reliance на другие языковые модели.

2 мин

29 октября 2025 г.

Новости

Gemma Scope: раскрытие механизмов языковых моделей

Gemma Scope — это открытый набор инструментов на основе разреженных автоэнкодеров для изучения внутренних механизмов моделей Gemma 2. Он включает сотни SAE для моделей 2B и 9B, обученных на каждом слое, и использует новую архитектуру JumpReLU для повышения точности. Релиз направлен на ускорение исследований интерпретируемости, способствуя созданию более безопасных ИИ-систем.

7 мин

24 октября 2025 г.

галлюцинации

Gemini 3.1 Pro Preview возглавила Intelligence Index вдвое дешевле

Новый бенчмарк: ИИ-модели часто галлюцинируют

Галлюцинации в цитатах NeurIPS

Ученые изучают LLM как пришельцев

Salesforce снижает доверие к большим языковым моделям

ИИ для кода и научных текстов: пора принять

Системное мышление в разработке ИИ-агентов

Мышление ИИ: что значит «думать» для нейросетей

SS&C Blue Prism: путь к агентной автоматизации

AI Expo 2026: Агентные системы и данные

Механистическая интерпретируемость: 10 прорывов 2026

Восхождение ИИ-терапевтов

ИИ не скоро заберёт работу у юристов

Почему AI-агенты для ресерча выдумывают факты

Elloe AI: иммунная система для ИИ

Gemma Scope: раскрытие механизмов языковых моделей

Сейчас в тренде

Популярные темы