Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Исследователи из Университета Твенте применили динамическое масштабирование напряжения и частоты (DVFS) на уровне ядер GPU и сократили энергопотребление при обучении модели GPT-3-xl на 14%, практически не замедлив процесс. Метод основан на точной настройке тактовых частот для каждой вычислительной операции, что позволяет экономить энергию без потери производительности.
DataRobot представил стандартизированные бенчмарки для LLM, измеряющие реальную производительность: максимальную конкурентность, задержку и стоимость токенов. Эти метрики позволяют точно рассчитать бюджет и инфраструктуру до запуска в продакшн.
Стартап Orbital Inc. анонсировал планы по созданию сети спутниковых дата-центров для ИИ-инференса. Компания рассчитывает использовать солнечную энергию в космосе, чтобы обойти дефицит мощностей на Земле. Первый тестовый запуск запланирован на 2027 год.
Google и NVIDIA на конференции Cloud Next анонсировали инфраструктуру A5X на Vera Rubin NVL72, снижающую затраты на ИИ-инференс в 10 раз и масштабирующуюся до 960 тыс. GPU. Решения включают confidential computing для регулируемых отраслей, managed clusters для агентного ИИ и инструменты для промышленных симуляций. Это ускоряет enterprise-применение ИИ от обучения до производства.
Microsoft анонсировал инвестиции в 10 миллиардов долларов в Японию на ИИ-инфраструктуру, кибербезопасность и обучение кадров с 2026 по 2029 год. С партнерами вроде SoftBank компания запустит локальные GPU-сервисы Azure и подготовит миллион специалистов к 2030 году. Это ответ на будущий дефицит 3,26 миллиона экспертов по ИИ и роботам к 2040 году.
Duos Edge AI и LG CNS предлагают модульные дата-центры для ИИ, доставляемые на грузовиках и разворачиваемые за 6 месяцев вместо 2–3 лет. Каждый блок вмещает 576 GPU Nvidia с опцией роста до тысяч, что ускоряет запуск ИИ-инфраструктуры и снижает затраты вдвое за мегавакт. Рынок таких решений удвоится к 2030 году.
Подразделение сетевых технологий Nvidia выросло до 11 миллиардов долларов за квартал благодаря приобретению Mellanox и буму ИИ. Оно стало вторым по выручке после чипов, обогнав квартальные показатели Cisco. На GTC анонсировали платформу Rubin и новые коммутаторы для ИИ-фабрик.
Стартап Niv-AI из Тель-Авива привлек $12 млн seed для борьбы с потерями энергии в ИИ-кластерах на GPU. Сенсоры измеряют потребление с миллисекундной точностью, а ИИ-модель предсказывает пики и выравнивает нагрузки. Через полгода технология заработает в дата-центрах США, помогая избежать троттлинга на 30%.
На Computex 2026 Nvidia представила RTX Spark — версию суперчипа GB10 для Windows-ПК. Устройства на его базе анонсировали Microsoft, Asus, Dell и другие. Эксперты отмечают, что ключевое преимущество Nvidia — программная экосистема, но успех будет зависеть от того, сможет ли Windows на Arm стать массовой альтернативой x86-системам.
Дата-центры с гигаскальными ИИ-нагрузками сталкиваются с парадоксом питания из-за резких импульсов от GPU-кластеров, угрожающих сетям. Полутвердотельные батареи Ampace в связке с ИБП Eaton гасят миллисекундные пики, обеспечивая стабильность, безопасность и экономию без переразмеровки. Это позволяет масштабировать ИИ-инфраструктуру эффективно и надежно.
Статья описывает реальные трудности локального запуска LLM: от нехватки VRAM и задержек до проблем с промптами и дообучением. Подробно разобраны обходные пути вроде квантизации, оптимизации контекста и тестирования шаблонов. Само-хостинг требует инвестиций в железо и методичный подход, но даёт полный контроль.
ИИ-индустрия столкнулась с дефицитом вычислительных мощностей из-за бума агентов: Anthropic мучается отключениями с 98,95% аптаймом, OpenAI закрывает Sora. Провайдеры ввели лимиты и квоты, цены на GPU Nvidia Blackwell выросли на 48%, спрос превысит предложение до 2029 года.
MLCommons выпустила результаты MLPerf Inference v6.0 с новыми мультимодальными тестами: Nvidia лидирует с 288 GPU и 2,7x софт-оптимизацией, AMD догоняет в single-node до 119% от B200 Nvidia, Intel фокусируется на workstations. Результаты сложно сравнивать напрямую из-за разных подходов. Nvidia продвигает тест для реального API-трафика.
NVIDIA RTX PRO 6000 Blackwell Workstation Edition радикально ускоряет науку о данных, обеспечивая до 50-кратный прирост в обработке с cuDF и поддержку до 4 GPU на столе. Она упрощает весь пайплайн от подготовки данных до деплоя, включая визуализации и обучение XGBoost. Это снижает зависимость от облаков, экономит средства и усиливает безопасность.
DataRobot и Nebius объединились для создания AI Factory for Enterprises — платформы, ускоряющей разработку и запуск ИИ-агентов в продакшен за дни. Комбинация Agent Workforce Platform DataRobot и облака Nebius обеспечивает масштабируемость, контроль, мониторинг и безопасность. Поддерживаются фреймворки вроде LangChain, развертывание NIM, Workload API и оценка с OTel.
DataRobot подтвердила NVIDIA RTX PRO 4500 с архитектурой Blackwell как оптимальный движок для платформы Agent Workforce. Карта с 32 ГБ GDDR7 идеальна для локального запуска агентов, низких задержек и защиты данных в логистике с cuOpt и RAG с NeMo Retriever. Платформа добавляет инструменты runtime и build для безопасного управления.