Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Даррен Моурри из Google Cloud в подкасте Equity обсуждает давление на ИИ-стартапы: от кредитов к реальным расходам на облако и выбору инфраструктуры. Рассматриваются тренды внедрения ИИ, конкуренция провайдеров вроде AWS и Microsoft, а также перспективы в биотехе и климат-техе. Основатели получают советы, чтобы избежать неожиданных проблем при масштабировании.
Дефицит чипов памяти вызван бумом ИИ и цикличностью рынка DRAM: спрос на HBM для GPU в дата-центрах превышает предложение, цены выросли на 80–90%. Крупные компании запаслись до 2028-го, новые фабрики запустятся не раньше 2027–2030. Цены останутся высокими, технологии вроде HBM4 усилят спрос.
Cisco внедряет ИИ в свои операции и предлагает клиентам проверенную инфраструктуру на базе GPU и сетей. Компания фокусируется на автоматизации, безопасности, edge-вычислениях и переходе к агентному ИИ. Это помогает строить production-grade системы для любых масштабов.
Microsoft показывает сильный рост облачных доходов благодаря ИИ, но акции падают из-за сомнений в окупаемости трат. Почти половина коммерческого backlog компании приходится на OpenAI, что усиливает опасения инвесторов по поводу зависимости. Финдиректор Эми Худ подчеркивает разнообразие других клиентов и приоритетное распределение мощностей.
Китай разрешил ByteDance, Alibaba и Tencent импортировать более 400 тысяч чипов Nvidia H200. Одобрения связаны с визитом CEO Nvidia Дженсена Хуанга и идут с жесткими условиями. Китайские компании уже заказали свыше двух миллионов таких чипов, хотя Nvidia не справляется с объемом.
Runpod, платформа для AI-хостинга, достигла 120 миллионов долларов годового дохода, начав путь с переоборудования майнинг-риггов в серверы и поста в Reddit. Основатели самостоятельно выросли до миллиона выручки, привлекли 20 миллионов инвестиций и теперь обслуживают 500 тысяч пользователей, включая OpenAI и Replit. Сервис фокусируется на удобстве для разработчиков в условиях жёсткой конкуренции.
Nvidia интегрирует свои GPU в EDA-инструменты Siemens, чтобы ускорить проектирование чипов. Партнеры планируют цифровые двойники систем вроде Vera Rubin для тестирования до производства. Об этом рассказал Дженсен Хуанг на CES 2026.
На CES 2026 Nvidia показала платформу Vera Rubin с пятикратным приростом ИИ-инференса, открытое ПО Alpamayo для беспилотников и DLSS 4.5. Планы охватывают суперкомпьютеры, автономное вождение с Mercedes и графику до 2028 года. Фирма уверена в лидерстве по всей цепочке ИИ.
ByteDance ведет переговоры с Samsung о производстве чипа SeedChip для ИИ и доступе к редким чипам памяти. Планируется выпуск до 350 тысяч штук в этом году и огромные траты на ИИ в 2026-м. Руководство признает отставание от OpenAI, но компания отрицает проект.
Эффективность пайплайна определяет скорость прогресса в машинном обучении. Разбираем пять типичных узких мест — от загрузки данных до инференса — и практические способы их фикса. Быстрые итерации дают преимущество над сложными моделями.
OpenAI недовольна скоростью чипов Nvidia для инференса и заключила крупную сделку с Cerebras. Переговоры с Groq прервались из-за Nvidia, а инвестиции на $100 млрд пока висят. Компания ищет чипы с встроенной памятью для ускорения ответов моделей.
Цепочка поставок аппаратного обеспечения раскрывает темпы ИИ-бума: ASML получила рекордные заказы на 13 млрд евро благодаря спросу на чипы для дата-центров. CEO Кристоф Фуке связывает это с устойчивым интересом к ИИ. Пока нет признаков спада в инфраструктурных вложениях.
Ollama теперь поддерживает генерацию изображений ИИ локально на macOS с моделями Z-Image Turbo и Flux 2 Klein. Функция экспериментальная, с планами на расширение. Пользователи могут настраивать параметры и сохранять результаты в удобном формате.
Epoch AI собрала базу данных по продажам AI-чипов: глобальная мощность ИИ превысила 15 миллионов эквивалентов H100, а оборудование жрет больше 10 ГВт. Новый B300 от Nvidia доминирует в доходах компании, H100 потерял лидерство. Данные открыты для всех и основаны на отчетах и оценках.
На CES 2026 AMD раскрыла платформу Helios на чипах MI400, серию Ryzen AI 400 "Gorgon Point" для ноутбуков и новые варианты Strix Halo для портативного гейминга. Грег Брокман из OpenAI подтвердил значимость этих чипов для их инфраструктуры, а компания намекнула на MI500 с 1000-кратным приростом мощности.
Дата-центры ИИ упираются в пределы медных кабелей, требуя новых решений для плотных соединений GPU. Стартапы Point2 и AttoTude предлагают радио-кабели на миллиметровых и терагерцовых волнах, сочетающие преимущества меди и оптики. Эти системы обеспечивают дальность до 20 метров, низкое энергопотребление и упрощают масштабирование.