Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

Google представила TPUs 8-го поколения, платформу агентов и ИИ-слой для Workspace

Google на Cloud Next '26 представила TPUs 8t для обучения и 8i для инференса, способные масштабироваться до миллиона чипов в кластере с 97% goodput. Платформа Gemini Enterprise Agent Platform упрощает создание и запуск агентов с памятью и безопасностью, а Workspace Intelligence связывает сервисы вроде Gmail и Docs. Новинки усиливают фокус на автономных системах в конкуренции с Nvidia.

23 апреля 2026 г.
5 мин
0

На конференции Cloud Next '26 Google показала восьмое поколение TPU, обновленную платформу для агентов и новый ИИ-слой в Workspace. Всё это объединено под концепцией "Agentic Enterprise".

Впервые компания разделила Tensor Processing Units на две линейки: TPU 8t предназначена для обучения моделей, а TPU 8i — для инференса. По словам Amin Vahdat, старшего вице-президента и главного технолога по ИИ и инфраструктуре, такое разделение вызвано ростом нагрузки на инференс от агентов, которые циклически планируют, действуют и учатся.

В отличие от Nvidia, Google делает ставку не столько на мощность одного чипа, сколько на масштабирование. Как пишет The Register, будущие GPU Rubin от Nvidia дают больше вычислений и пропускной способности памяти на чип, чем TPU 8t. Однако при обучении передовых моделей ключевым становится количество чипов, которые удается эффективно соединить.

Здесь Google впереди, отмечает The Register. Последние GPU Nvidia объединяют до 576 ускорителей в одной NVLink-домене, после чего подключаются более медленные Ethernet или InfiniBand. Google же использует оптические коммутаторы для связи 9600 TPU в одном поде. Новая сеть Virgo объединяет несколько дата-центров в кластеры до миллиона TPU. Система хранения Lustre напрямую загружает данные в память ускорителей. Цель — "goodput" на уровне 97 процентов, то есть доля времени, когда чипы обучают модель, а не ждут контрольных точек или восстанавливаются от ошибок.

Чип TPU 8i для инференса жертвует частью вычислений ради большего объема SRAM на кристалле и ускоренного HBM. Увеличенный SRAM позволяет хранить ключ-значения кэш — память модели о прошлых ответах — прямо на чипе, чтобы ядра не простаивали в ожидании данных. Движок Collective Acceleration Engine ускоряет модели с смесью экспертов. Google создала топологию сети Boardfly для снижения задержек между чипами.

Оба варианта TPU теперь работают на процессорах Axion на базе Arm — впервые в истории.

Единая платформа для создания и запуска агентов

В программной части Google собрала свои ИИ-сервисы в Gemini Enterprise Agent Platform на базе Vertex AI. Для разработки есть инструмент для визуализации взаимодействия нескольких агентов в виде блок-схемы, а также интерфейс Agent Studio для их создания через естественный язык. Центральный реестр помогает избежать дублирования похожих агентов в организации.

Для запуска агентов Google устраняет типичные проблемы. Долгоживущие агенты теперь самостоятельно справляются с многоэтапными задачами, не требуя вмешательства человека на каждом шаге. Изолированные песочницы позволяют выполнять код или автоматизировать браузер без риска для хост-систем. Memory Bank обеспечивает долгосрочную память, чтобы агенты не сбрасывали контекст при каждой сессии.

Интерфейс Gemini Enterprise Agent Platform

Автономные агенты создают новые уязвимости, поэтому Google добавила меры защиты: криптографические идентификаторы для каждого агента, фильтры против инъекций промтов, обнаружение аномалий вроде несанкционированного доступа к данным или бесконечных циклов рассуждений. Инструменты симуляции тестируют агентов на синтетических взаимодействиях с пользователями до реального развертывания. Насколько эти меры надежны, покажет практика.

Поддерживаемые модели: Gemini 3.1 Pro, Nano Banana 2, Lyria 3, а также Claude Opus, Sonnet, Haiku от Anthropic и свежий Claude Opus 4.7.

Сопутствующее приложение Gemini Enterprise ориентировано на конечных пользователей: сотрудники собирают агентов из готовых блоков, отслеживают задачи в интерфейсе вроде почтового ящика и редактируют документы прямо в приложении.

Workspace Intelligence как общий слой знаний

Параллельно запущена Workspace Intelligence — слой, связывающий контент в Gmail, Docs, Drive, Meet и Chat. Благодаря этому Gemini и агенты на его базе понимают связи между письмами, встречами, чатами и файлами, а не опрашивают приложения по отдельности.

В Gmail ИИ сортирует входящие и обобщает темы. В Google Chat из бесед создаются события в календаре или документы. В Docs генерируется текст из писем и файлов; в Sheets — дашборды; в Slides — презентации. Drive Projects объединяет файлы и emails по темам. Для перехода с Microsoft 365 Google упростила миграцию.