Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Фонд ARC Prize изучил 160 сессий GPT-5.5 и Opus 4.7 на ARC-AGI-3 и нашёл три системных паттерна ошибок рассуждений, из-за которых модели не превышают 1%. Эти проблемы — от потери общей картины до ложных аналогий и неверификации успехов — актуальны для реальных ИИ-агентов. Анализ перекликается с выводами других исследований о слабом понимании у языковых моделей.
Илон Маск дал показания в суде по иску против OpenAI, под присягой признав, что Tesla не работает над AGI вопреки своему твиту. Адвокаты обвиняемых показали его прошлую поддержку коммерциализации компании и попытки переманить сотрудников. Дело фокусируется на рисках для безопасности ИИ и структуре прибыли инвесторов.
OpenAI и Microsoft обновили партнёрское соглашение, устранив эксклюзивность по Azure и клаузу об AGI. Теперь OpenAI свободен в выборе облачных провайдеров, а Microsoft обеспечил себе лицензию до 2032 года. Распределение доходов упростилось: Microsoft больше не платит OpenAI, но выигрывает как акционер.
Гендиректор DeepMind Демис Хассабис оценил AGI как десять промышленных революций, сжатых в одну декаду, с высоким шансом реализации в ближайшие пять лет. Нужны прорывы в непрерывном обучении, планировании и памяти, поскольку текущие модели остаются нестабильными. ИИ сейчас перехвален短期, но его долгосрочный эффект недооценен.
OpenAI проводит перестановки в руководстве из-за проблем со здоровьем у ключевых топ-менеджеров. Фиджи Симо уходит в больничный, Грег Брокман берёт продукты, включая суперприложение, а Брэд Лайткап переходит в special projects. Обязанности распределяют Джейсон Квон, Сара Фрайар, Дениз Дрессер и Гэри Бриггс.
Фонд ARC Prize представил бенчмарк ARC-AGI-3, где ИИ-агенты самостоятельно осваивают игровые среды без подсказок — люди решают все 135 задач легко, frontier-модели набирают менее 1%. Метрика RHAE карает за неэффективность квадратично, лидерборд исключает кастомные обвязки. Конкурс на Kaggle предлагает $2 млн за результат на уровне человека.
Исследователи из Колумбийского университета, NYU и Distyl с Яном ЛеКуном критикуют AGI как несостоятельную идею, поскольку человеческий интеллект специализирован. Они предлагают сверхчеловеческий адаптивный интеллект (SAI), фокусируясь на скорости адаптации к задачам. Рекомендуют обучение с самонадзором и модели мира вместо доминирующих языковых моделей.
Сэм Альтман из OpenAI заявил, что AGI близко, супер-интеллект не заставит ждать, а компания ускоряет разработки с помощью своих моделей. Мир не готов к этим прорывам, которые радикально изменят профессии вроде программирования и дизайна. Модель Codex 5.3 уже помогала в своей собственной разработке.
Goodfire представила Silico — платформу механистической интерпретируемости для LLM. Инструмент автоматизирует анализ нейронов, помогает исправлять галлюцинации, этические сбои и ошибки вроде сравнения 9.11 с 9.9. Это позволит малым командам создавать надежные модели без проб и ошибок.
Microsoft и OpenAI перезаключили партнерство, установив срок до 2032 года и убрав эксклюзив на облачные сервисы. Это решает конфликт из-за инвестиций Amazon до 50 миллиардов долларов и эксклюзива на Frontier и stateful runtime. Microsoft сохраняет 27% акций и доходы, предприятия получают выбор провайдеров.
Глоссарий разбирает ключевые термины ИИ от AGI и LLM до галлюцинаций и весов. Объяснения охватывают определения, примеры и связи понятий вроде цепочки мыслей, дистилляции, диффузии. Материал помогает ориентироваться в новостях ИИ, сохраняя все технические детали.
CTO Databricks Matei Захария получил премию ACM Prize in Computing за вклад в Spark и развитие big data. Компания достигла оценки в 134 млрд долларов и выручки 5,4 млрд. Он уверен, что AGI уже существует, но человеческие стандарты мешают, а ИИ идеален для автоматизации исследований.
Сооснователь OpenAI Грег Брокман заявил, что модели GPT reasoning имеют прямой путь к AGI, и споры об этом завершены. OpenAI свернула Sora, сосредоточившись на GPT из-за ресурсов, несмотря на ценность world models. Исследователи вроде ЛеКуна, Хассабиса, Шолле и других сомневаются в текстовых LLM и предлагают альтернативы вроде симуляций.
Microsoft реорганизует ИИ-подразделение, объединяя Copilot-команды и усиливая фокус на моделях до супер-интеллекта под руководством Мустафы Сулеймана. Сатья Наделла меняет риторику, делая собственные разработки приоритетом после провала MAI и рисков от внешних платформ вроде Claude Cowork. Критика Наделлы интеграций Copilot подталкивает к внутренним изменениям.
OpenAI пытается исключить показания Стюарта Рассела в суде с Маском, называя его «doomer», хотя Сэм Альтман подписывал его предупреждения о рисках ИИ. Компания спешит с моделями вроде GPT-4o, сокращая команды безопасности. The Midas Project указывает на противоречия и вспоминает прошлые повестки от OpenAI.
Бывший ведущий исследователь DeepMind Дэвид Сильвер привлекает 1 млрд долларов на seed-раунд для стартапа Ineffable Intelligence, чтобы создать супер-интеллект на базе обучения с подкреплением, обходя большие языковые модели. Компания получит оценку в 4 млрд долларов, инвесторы — Sequoia, Nvidia, Google и Microsoft. Сильвер следует тренду среди топ-специалистов вроде Sutskever и Hassabis, сомневающихся в трансформерах.