Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Нулевые простои для ИИ-агентов требуют не только работающей инфраструктуры, но и стабильного поведения, контроля затрат и качества решений. Статья описывает трехуровневую модель доступности: инфраструктура, оркестрация и уровень агента, с адаптацией стратегий развертывания вроде голубой-зеленых и канареек. Наблюдаемость поведения, задержек и токенов — ключ к безопасным обновлениям без потери доверия пользователей.
Гендиректор Nvidia Дженсен Хуанг заявил, что разработчик с зарплатой $500 тысяч в год должен тратить на ИИ-токены минимум $250 тысяч, иначе это вызывает тревогу. Он сравнил такую экономию с отказом от профессиональных CAD-инструментов. Прогнозы Anthropic по доходам от ИИ в сотни миллиардов долларов к 2028 году Хуанг назвал консервативными.
Anthropic отменила надбавку за контекстные окна свыше 200 тысяч токенов в Claude Opus 4.6 и Sonnet 4.6, сделав миллион токенов доступным по стандартным ценам 5/25 и 3/15 долларов за миллион. Лимит на изображения и PDF вырос до 600 за запрос, новые тарифы работают в Claude Code и через облачные платформы. Модели лидируют по точности на полном контексте, хотя общие проблемы с длинными промптами сохраняются.
Anthropic разобралась с жалобами на быстрый расход лимитов в Claude Code: виноваты пиковые ограничения и растущие контексты до 1 млн токенов. Компания исправила баги, улучшила эффективность и добавила уведомления. Пользователям рекомендуют Sonnet 4.6 вместо Opus, отключение Extended Thinking и свежие сессии.
Alibaba собирает ИИ-направления в Token Hub под прямым руководством CEO Эдди Ву, включая команды Qwen, DingTalk и устройства Quark. Это поможет ускорить монетизацию ИИ и представить агента для бизнеса с интеграцией в Taobao и Alipay. Китайским компаниям сложнее зарабатывать из-за скепсиса пользователей к платным сервисам.
Stripe анонсировала функцию биллинга, которая позволяет ИИ-стартапам автоматически добавлять маржу до 30% к затратам на токены LLM и передавать их клиентам. Инструмент отслеживает цены API моделей и совместим с шлюзами вроде Vercel и OpenRouter. Это решает проблему убытков от неконтролируемого потребления токенов в агентских приложениях.
Показаны все статьи (6)