Google меняет подход: из пользователя своих чипов превращается в их продавца, что напрямую угрожает лидерству Nvidia на рынке. Свежий обзор показывает, что само наличие новейших TPU от Google уже помогает снижать стоимость вычислений для ИИ.
Долгое время Google применял свои тензорные процессоры (TPU) в основном для внутренних задач по обучению ИИ-моделей. Теперь с появлением TPUv7 под названием "Ironwood" компания меняет курс. Как отмечают эксперты по чипам из SemiAnalysis в своем анализе, Google активно предлагает свой кремний внешним клиентам, становясь серьезным конкурентом Nvidia.
Anthropic лидирует среди покупателей. По данным обзора, сделка стартапа предусматривает около одного миллиона TPU, которые делятся на прямые закупки оборудования и аренду через Google Cloud Platform (GCP). Инфраструктура для такого объема оборудования требует мощности свыше одного гигаватта.
Рынок уже реагирует на эти изменения. SemiAnalysis сообщает, что OpenAI добился скидки примерно в 30 процентов на свой парк Nvidia, просто убедительно намекнув на возможный переход к TPU или другим вариантам.
"Чем больше TPU вы приобретаете, тем больше экономите на капитальных затратах для Nvidia GPU", — шутят аналитики Dylan Patel, Myron Xie и Daniel Nishball, перефразируя известный слоган CEO Nvidia Дженсена Хуана: "чем больше покупаете, тем больше сберегаете".
TPU справляются с самыми мощными моделями ИИ
Данные по использованию подтверждают: TPU больше не выглядят как запасной вариант. Две из самых продвинутых ИИ-моделей, выпущенных недавно, — Gemini 3 Pro от Google и Claude 4.5 Opus от Anthropic, — в основном опираются на TPU Google и чипы Trainium от Amazon. Обучение Gemini 3 прошло полностью на TPU.
С технической стороны TPUv7 "Ironwood" почти догоняет поколение Blackwell от Nvidia по пиковой вычислительной мощности (FLOPs) и пропускной способности памяти, судя по оценкам SemiAnalysis. Но главное преимущество — в цене.
Для Google общая стоимость владения (TCO) одним чипом на 44 процента ниже, чем у эквивалентной системы Nvidia GB200. Даже для внешних заказчиков вроде Anthropic, которые платят наценку, стоимость за единицу эффективных вычислений может оказаться на 30–50 процентов ниже, чем у Nvidia, по модели аналитиков.
Это преимущество усиливается для команд, которые хорошо настраивают свое ПО. Система Google объединяет до 9216 чипов в единую плотную сеть. Такая конструкция упрощает распределение огромных задач по обучению ИИ по сравнению с типичными кластерами Nvidia, где плотно связывают обычно 64–72 чипа.
Обновления ПО помогают разорвать зависимость от CUDA
ПО всегда было главным препятствием для распространения TPU, поскольку платформа CUDA от Nvidia стала отраслевым эталоном. Google вкладывает серьезные ресурсы, чтобы устранить эту преграду. В отчете говорится, что компания разрабатывает встроенную поддержку популярного фреймворка PyTorch и интеграцию с библиотеками для вывода, такими как vLLM.
Задача — сделать TPU реальной альтернативой, не заставляя разработчиков перестраивать весь свой инструментарий с нуля. Однако основа стека ПО для TPU — компилятор XLA — остается закрытой. SemiAnalysis считает это упущенной возможностью, ведь открытие кода могло бы ускорить вовлечение более широкого круга специалистов.
Чтобы развернуть такой объем кремния, Google прибегает к нестандартным финансовым схемам. Компания сотрудничает с "неоклаудами" вроде Fluidstack и майнерами криптовалют, такими как TeraWulf. В этих соглашениях Google часто выступает гарантом: если оператор не справится, компания покроет арендные платежи. Такой подход позволяет быстро переоборудовать дата-центры для майнинга крипты в мощности для ИИ.
Следующее поколение Nvidia может стереть ценовое преимущество
Под давлением успехов Google Nvidia готовит технологический ответ. Ее чипы следующего поколения "Vera Rubin", которые ждут в 2026 или 2027 году, включают смелые решения вроде памяти HBM4 и очень высокой пропускной способности.
Ответ Google — TPUv8 — строится на двойной стратегии, по версии SemiAnalysis. Компания выпустит две версии: одну с давним партнером Broadcom (кодовое имя "Sunfish") и другую с MediaTek (кодовое имя "Zebrafish"). Несмотря на разнообразие, конструкции выглядят осторожными. Аналитики указывают на задержки в проекте и опору на архитектуру, которая избегает агрессивного применения 2-нм техпроцесса TSMC или HBM4, как у соперников.
Для Google ставки высоки. Если Nvidia успешно реализует прирост производительности для Rubin, нынешнее ценовое превосходство TPU может исчезнуть. SemiAnalysis предупреждает о сценарии, где системы Rubin от Nvidia — в частности, "Kyber Rack" — окажутся выгоднее даже для внутренних задач Google по сравнению с ее собственной TPUv8.
"Google раскрыл карты, и теперь Nvidia должна выполнить план, чтобы сохранить место короля в пищевой цепочке", — подводит итог SemiAnalysis. Если лидер рынка идеально воплотит свою дорожную карту, он удержит позиции. Но если Nvidia споткнется в производительности или опоздает с Rubin, ее доминирование окажется под реальной угрозой.