Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

ИИ-индустрия исчерпывает вычислительные мощности: отключения, рационирование и рост цен на GPU

ИИ-индустрия столкнулась с дефицитом вычислительных мощностей из-за бума агентов: Anthropic мучается отключениями с 98,95% аптаймом, OpenAI закрывает Sora. Провайдеры ввели лимиты и квоты, цены на GPU Nvidia Blackwell выросли на 48%, спрос превысит предложение до 2029 года.

13 апреля 2026 г.
4 мин
10

Спрос на ИИ-агентов растет взрывными темпами и упирается в нехватку вычислительных ресурсов. У Anthropic постоянные отключения, OpenAI сворачивает Sora, а цены на GPU взлетели почти на 50%, показывают рыночные данные.

Бум ИИ расходует мощности быстрее, чем их удается наращивать. Как пишет Wall Street Journal, стремительный подъем автономных ИИ-агентов, способных самостоятельно выполнять задачи, спровоцировал острый дефицит ресурсов за последние месяцы. В итоге лидеры рынка сталкиваются с сбоями, отменой или урезанием продуктов и резким подорожанием чипов.

Anthropic быстро растет, но не справляется с нагрузкой

Разработчик чат-бота Claude и приложения для кодинга Claude Code — компания Anthropic — пострадала особенно сильно. С середины февраля сбои происходят так часто, что корпоративные клиенты переходят к конкурентам, сообщает WSJ. Основатель платформы Retool Дэвид Хсу рассказал издание, что предпочитает модель Opus 4.6 от Anthropic, но недавно перешел на OpenAI из-за постоянных падений сервиса.

По данным отчета, доступность Claude API за 90 дней по 8 апреля составила 98,95%, что гораздо ниже 99,99%, к чему привыкли пользователи традиционных облачных провайдеров.

При этом Anthropic развивается невероятными темпами. Годовая выручка в пересчете на год (ARR) достигла 9 млрд долларов к концу 2025 года, в феврале выросла до 14 млрд, а через два месяца перевалила за 30 млрд.

OpenAI сворачивает Sora, чтобы перекинуть мощности на кодинг и корпоративные инструменты

OpenAI тоже ощущает давление. Компания объявила о закрытии приложения для генерации видео Sora, в том числе чтобы высвободить ресурсы для инструментов кодинга и корпоративных продуктов на базе новой модели под кодовым именем Spud. Веб- и мобильные версии Sora отключат 26 апреля, API — в сентябре.

Использование токенов в API OpenAI выросло с 6 млрд в минуту в октябре до 15 млрд к концу марта, указывает WSJ. Финдиректор OpenAI Сара Фрайр сообщила изданию, что значительную часть времени тратит на поиск ближайших мощностей, а компании приходится отказываться от проектов из-за их отсутствия.

Провайдеры вводят ограничения с января, чтобы справиться с ажиотажем вокруг агентов

Дефицит меняет подходы к инструментам для разработчиков, где все чаще запускают ресурсоемкие задачи ИИ-агентов с большим расходом токенов.

GitHub 10 апреля объявил о новых лимитах для Copilot, сославшись на быстрый рост нагрузки, высокую параллельность и интенсивное использование. Пользователи, упершиеся в потолки, вынуждены ждать или менять модели.

OpenAI в начале апреля перешел на учет токенов для корпоративного Codex вместо фиксированной цены за сообщение и запустил новый тариф Pro за 100 долларов, подходящий для длительных сессий кодинга с высоким потреблением. Более дешевый план Plus скорректировали, чтобы поощрять множество коротких взаимодействий в течение недели вместо редких пиковых нагрузок.

Windsurf в марте заменил кредиты на дневные и недельные квоты с возможностью докупки по ценам API. Anthropic в конце марта изменил лимиты сессий и временно удвоил использование в непиковые часы для равномерного распределения нагрузки.

Общая картина очевидна: обычный чат и задачи агентов все чаще разделяют по ценообразованию, а интенсивные нагрузки регулируют через отдельные пулы, кредиты и доплаты за токены.

Цены на GPU взлетают, инфраструктура отстает

Спотовые цены на ускорители Nvidia резко пошли вверх. По индексу Ornn Compute Price, час работы на чипе последнего поколения Blackwell теперь стоит 4,08 доллара — на 48% дороже, чем 2,75 доллара два месяца назад.

WSJ пишет, что Coreweave, один из крупнейших публичных облачных провайдеров для ИИ, в конце 2025 года поднял цены более чем на 20% и теперь обязывает мелких клиентов подписывать трехлетние контракты вместо годовых. Аналитики Bank of America прогнозируют, что спрос превысит предложение минимум до 2029 года.

Гендиректор Vultr Дж.Дж. Кардуэлл заявил WSJ, что нынешний кризис мощностей — самый тяжелый за пять лет работы его облачной инфраструктуры. Он назвал ключевые узкие места: длительные сроки поставок оборудования, медленное строительство дата-центров и полное отсутствие свободной энергии до 2026 года.

Повышение цен помогает бороться с дефицитом. Однако для ведущих ИИ-компаний, борющихся за пользователей, такой шаг чреват рисками.