Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Даррен Моурри из Google Cloud в подкасте Equity обсуждает давление на ИИ-стартапы: от кредитов к реальным расходам на облако и выбору инфраструктуры. Рассматриваются тренды внедрения ИИ, конкуренция провайдеров вроде AWS и Microsoft, а также перспективы в биотехе и климат-техе. Основатели получают советы, чтобы избежать неожиданных проблем при масштабировании.
Microsoft запустила чип Maia 200 для эффективного инференса ИИ с производительностью свыше 10 петафлопс в 4-битной точности. Он помогает снизить зависимость от Nvidia и уже используется в проектах Copilot и Superintelligence. Чип конкурирует с TPU Google и Trainium Amazon по ключевым метрикам.
Nvidia берет на борт конкурента Groq за 20 миллиардов долларов — это рекордная сделка для компании. Groq предлагает чипы LPU, которые в 10 раз быстрее Nvidia GPU для языковых моделей и экономят энергию. Стартап быстро растет и уже обслуживает миллионы разработчиков.
Google предлагает Meta и другим компаниям запускать свои чипы TPU в их дата-центрах, чтобы конкурировать с Nvidia. Meta может потратить миллиарды на это оборудование, которое заработает в 2027 году. Руководство Google Cloud надеется захватить 10% дохода Nvidia благодаря новой программе и улучшенному ПО.
Nvidia уверяет, что её графические процессоры опережают чипы Google для ИИ на целое поколение, подчёркивая универсальность своей платформы. Компания реагирует на падение акций из-за слухов о сделке Meta с Google и отмечает растущий спрос на свои продукты. Google, в свою очередь, сочетает собственные тензорные процессоры с решениями Nvidia.
Anthropic нанимает экс-менеджеров Google, чтобы построить сеть дата-центров на 10 ГВт и больше. Фирма входит в гонку с OpenAI за вычисления, видя в них ключ к росту, но сталкивается с протестами из-за энергозатрат. Крупные игроки обещают покрывать счета за электричество.
Nvidia якобы приобретает Groq за 20 миллиардов долларов, чтобы интегрировать её чипы с низкой задержкой и получить ключевых инженеров. Сделка помогает справиться с ростом цен на память HBM, конкуренцией в инференсе и нуждами ИИ-агентов. Это укрепляет позиции компании в специализированных задачах и блокирует соперников вроде AMD и Cerebras.
Anthropic разместила у Broadcom заказы на стойки Ironwood с чипами Google TPU на сумму около 21 млрд долларов. Сделка дополняет облачное партнёрство с Google, в рамках которого стартап получит доступ до одного миллиона TPU и более одного гигаватта новых ИИ-мощностей к 2026 году, сохраняя при этом мультиоблачную стратегию с использованием Google TPU, Amazon Trainium и GPU Nvidia.
Google расширяет продажи своих TPU, что уже помогает клиентам вроде OpenAI экономить до 30 процентов на оборудовании Nvidia. Новые чипы TPUv7 "Ironwood" конкурируют с Blackwell по мощности, но выигрывают по цене, а ПО Google упрощает переход от CUDA. В будущем Nvidia с Rubin может вернуть преимущество, если не допустит ошибок.
Google собирается удваивать серверные мощности каждые шесть месяцев, чтобы за четыре-пять лет увеличить инфраструктуру для ИИ в 1000 раз и удовлетворить растущий спрос. Руководитель подразделения подчеркивает риски от недостаточных инвестиций, особенно в облачных сервисах, которые уже показывают 33% годовой рост. Эксперты отмечают, что проблемы с инфраструктурой — главная причина неудач 80% ИИ-проектов, и гиганты вроде Google, Microsoft и Amazon вкладывают в это сотни миллиардов долларов.
Показаны все статьи (10)