Андреа Валлоне, старший специалист по безопасности в OpenAI, перешла в Anthropic. Она присоединится к команде по выравниванию ИИ, которая занимается рисками моделей. За три года работы в OpenAI Валлоне запустила группу исследований "Model Policy" и помогла с проектами вроде GPT-4, GPT-5 и моделей для рассуждений.
В последний год она курировала в OpenAI изучение важного вопроса: как моделям реагировать, если пользователи дают признаки эмоциональной привязанности или трудностей с психикой? Некоторые из них, включая подростков, покончили с собой после чатов с ботами. Родственники завели несколько судов, а Сенат США устроил слушания по теме.
В новой компании Валлоне будет отчитываться перед Джаном Лейке. Он сам возглавлял исследования безопасности в OpenAI, пока не ушел в мае 2024 года. Тогда Лейке публично упрекнул OpenAI: безопасность сдвинули на второй план ради новых релизов.