Специалист по ИИ-безопасности из OpenAI в Anthropic

Старший исследователь по безопасности Андреа Валлоне ушла из OpenAI в Anthropic, чтобы работать в команде по выравниванию ИИ. Она изучала реакцию моделей на эмоциональные проблемы пользователей и участвовала в создании GPT-4, GPT-5. Теперь подчиняется Джану Лейке, который сам критиковал OpenAI за игнор безопасности.

Андреа Валлоне, старший специалист по безопасности в OpenAI, перешла в Anthropic. Она присоединится к команде по выравниванию ИИ, которая занимается рисками моделей. За три года работы в OpenAI Валлоне запустила группу исследований "Model Policy" и помогла с проектами вроде GPT-4, GPT-5 и моделей для рассуждений.

В последний год она курировала в OpenAI изучение важного вопроса: как моделям реагировать, если пользователи дают признаки эмоциональной привязанности или трудностей с психикой? Некоторые из них, включая подростков, покончили с собой после чатов с ботами. Родственники завели несколько судов, а Сенат США устроил слушания по теме.

В новой компании Валлоне будет отчитываться перед Джаном Лейке. Он сам возглавлял исследования безопасности в OpenAI, пока не ушел в мае 2024 года. Тогда Лейке публично упрекнул OpenAI: безопасность сдвинули на второй план ради новых релизов.

Исследователь OpenAI перешел в Anthropic

Горячее

Тревожный сигнал: реальная цена ИИ от Google и Amazon

Alibaba запрещает сотрудникам использовать Claude Code

Последний экзамен человечества — отвлекающий манёвр?

Gemini Spark от Google теперь доступен на Mac

Anthropic представила Claude Science — ИИ-помощника для учёных

Сейчас в тренде