Разделение восьмого поколения TPU на два чипа
Google Cloud объявила о том, что восьмое поколение собственных чипов для ИИ, известных как тензорные процессоры (TPU), теперь делится на две версии. TPU 8t предназначена специально для обучения моделей, а TPU 8i — для инференса, то есть для работы моделей после ввода промтов пользователями.
Ключевые характеристики новинок
Компания подчеркивает значительные улучшения по сравнению с прошлыми поколениями: обучение моделей ускоряется до трех раз, производительность на доллар растет на 80%, а в одном кластере можно объединить более миллиона TPU. В итоге пользователи получают больше вычислительной мощности при меньших энергозатратах и расходах. Эти чипы называют TPU, а не GPU, поскольку изначально они создавались как энергоэффективные тензорные процессоры.
Дополнение, а не замена Nvidia
Чипы Google пока не угрожают доминированию Nvidia напрямую. Как и другие крупные облачные провайдеры — Microsoft и Amazon, — Google использует их для дополнения систем на базе Nvidia в своей инфраструктуре, а не для полной замены. Более того, в облаке Google скоро появится новейший чип Nvidia под названием Vera Rubin.
В перспективе гиперскейлеры вроде Amazon, Microsoft и Google, разрабатывающие собственные ИИ-чипы, могут снизить зависимость от Nvidia, когда предприятия перенесут свои ИИ-задачи в облака и адаптируют приложения под эти чипы.
Однако сейчас ставить против Nvidia рискованно. Аналитик рынка чипов Patrick Moorhead в шутку отметил в X, что еще в 2016 году предрекал проблемы Nvidia и Intel от первых TPU Google. Тем не менее Nvidia выросла до рыночной капитализации почти в 5 триллионов долларов, так что прогноз не сбылся.
По планам Nvidia, рост Google как ИИ-облачного провайдера принесет ей больше заказов, даже если многие задачи будут выполняться на чипах Google.
Сотрудничество с Nvidia по сетевым технологиям
Google также договорилась с Nvidia о совместной разработке сетевого оборудования для компьютеров, чтобы системы на чипах Nvidia работали в ее облаке еще эффективнее. В частности, они усиливают программную сетевую технологию Falcon, которую Google разработала и открыла в 2023 году под эгидой Open Compute Project — ключевой организации по открытому оборудованию для дата-центров.