Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Модель OpenAI o1-preview обошла врачей в задачах клинического мышления по реальным записям из приёмного покоя, достигнув 82% точности на финальном этапе против 79% и 70%. Исследование в Science подчёркивает потенциал ИИ, но отмечает отсутствие стандартов оценки и риски галлюцинаций. Учёные призывают тестировать модели в реальных сценариях и фокусироваться на взаимодействии с медиками.
OpenAI добавила Chronicle в Codex: функция записывает экран для создания контекста задач без повторных объяснений. Доступна Pro-подписчикам на macOS с предупреждениями о лимитах и рисках безопасности. Записи удаляются через шесть часов.
Фонд ARC Prize изучил 160 сессий GPT-5.5 и Opus 4.7 на ARC-AGI-3 и нашёл три системных паттерна ошибок рассуждений, из-за которых модели не превышают 1%. Эти проблемы — от потери общей картины до ложных аналогий и неверификации успехов — актуальны для реальных ИИ-агентов. Анализ перекликается с выводами других исследований о слабом понимании у языковых моделей.
Фонд Coatue запустил проект Next Frontier для покупки земли под будущие дата-центры ИИ рядом с мощными источниками энергии. Уже есть партнерство с Fluidstack, которая строит центры для Anthropic по сделке на 50 млрд долларов. В США ажиотаж вокруг дата-центров растет: строят более 1500 новых объектов, в основном в сельской местности.
Британский AISI протестировал GPT-5.5 от OpenAI: модель показала результаты на уровне Claude Mythos в киберзадачах и симуляциях атак. Она полностью прошла сетевую симуляцию TLO в 2 из 10 попыток, но jailbreak обошел все защиты. Тесты подтверждают рост автономных атакующих способностей ИИ.
Индия лидирует по использованию ChatGPT Images 2.0 после запуска, с 5 млн скачиваний за неделю против 2 млн в США. Глобально рост скачиваний составил 11%, но активность прибавила лишь 1%, с пиками до 79% в Пакистане, Вьетнаме и Индонезии. Пользователи в Индии создают личные портреты, аватары и фантазию, а модель улучшила поддержку хинди и бенгальского.
Илон Маск в калифорнийском суде подтвердил, что xAI частично использовала дистилляцию моделей OpenAI для обучения Grok — это распространенная практика в ИИ-индустрии. На фоне иска против OpenAI за коммерциализацию компания он отметил угрозу для гигантов от таких методов и составил рейтинг лидеров рынка с Anthropic на первом месте.
OpenAI достигла 10 гигаватт вычислительных мощностей для ИИ в США раньше срока 2029 года. За 90 дней компания заключила контракты на 3 ГВт, включая 2 ГВт от Amazon — это эквивалентно энергии для миллионов домов. Несмотря на планы роста, OpenAI отказалась от проектов Stargate в Техасе, Великобритании и Норвегии из-за энергопроблем.
Репозиторий на Hugging Face под видом релиза OpenAI распространял инфостилер для Windows. До удаления его скачали около 244 тысяч раз, но счётчик могли искусственно увеличить, сообщает HiddenLayer.
Amazon инвестировал дополнительные 5 миллиардов долларов в Anthropic, доведя общую сумму до 13 миллиардов. Взамен компания обязалась потратить более 100 миллиардов на AWS с получением 5 ГВт мощностей для Claude на чипах Trainium. Сделка похожа на недавнюю с OpenAI и может намекать на новый раунд на 800 миллиардов долларов.
На первой неделе суда Маск против OpenAI Илон Маск обвинил Альтмана и Брокмана в обмане, предупредил об апокалипсисе от ИИ и признался, что xAI дистиллирует модели OpenAI. Он описал три фазы разочарования в компании и потребовал вернуть некоммерческий статус. Адвокаты спорили о настоящем борце за безопасность ИИ и мотивах Маска.
OpenAI разобралась, почему с GPT-5.1 модели ChatGPT стали часто вставлять гоблинов в ответы: сбой в поощрении при дообучении 'Nerdy' личности вызвал 175-процентный рост упоминаний. Привычка распространилась на другие режимы через обратную связь, компания устранила дефект и добавила запреты. Случай подчёркивает риски непредвиденных эффектов от мелких изменений в обучении.
Anthropic запускает раунд на $50 млрд с оценкой около $900 млрд, который закроется через две недели. Компания показывает run rate дохода $40 млрд и готовится к IPO, обгоняя OpenAI по стоимости. Ранние инвесторы ждут публичного размещения.
OpenAI ограничила доступ к инструменту Cyber только для проверенных экспертов по кибербезопасности, повторив модель Anthropic с Mythos, которую ранее критиковал Сэм Альтман. Cyber предназначен для пентестирования, поиска уязвимостей и анализа вредоносного ПО. Компания намерена расширить доступ после согласований с властями США.
OpenAI запустила Advanced Account Security для ChatGPT с партнерством Yubico, выпустив YubiKey C NFC и YubiKey C Nano против фишинга. Защита подходит для высокорисковых пользователей вроде журналистов и чиновников, но требует осторожности с аппаратными ключами. Индустрия ИИ усиливает фокус на безопасность, следуя примеру Anthropic с моделью Mythos.
Anthropic рассматривает инвестиционные предложения, которые оценят компанию выше 900 миллиардов долларов и позволят обогнать OpenAI. Google вложил 10 миллиардов, Amazon — 5 миллиардов по старой оценке, компания планирует IPO в октябре. OpenAI сталкивается с проблемами по выручке.