Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
GitHub Copilot меняет модель оплаты: вместо лимита запросов вводятся кредиты ИИ по центу за штуку, где расход зависит от токенов. Pro-тариф даёт 1000 кредитов в месяц, автодополнение и Next Edit остаются без платы.
Opus 4.7 от Anthropic имеет равную с 4.6 цену, но расходует больше токенов — в среднем 1,325 раза на коде, до 1,47 раза на техдокументах и 37,4% по данным сообщества. Для сессии из 80 взаимодействий затраты вырастут на 20–30%. Модель лучше следует инструкциям — на 5 п.п. по IFEval.
Агентный ИИ выходит за рамки запланированных бюджетов из-за операционных расходов на эксплуатацию, управление и масштабирование. Проекты часто проваливаются при переходе в производство из-за неучтенных факторов вроде потребления токенов, неэффективности GPU и пробелов в governance. Стратегии вроде модульных фреймворков, serverless-инфраструктуры и автоматизированного мониторинга помогают контролировать затраты.
Anthropic разобралась с жалобами на быстрый расход лимитов в Claude Code: виноваты пиковые ограничения и растущие контексты до 1 млн токенов. Компания исправила баги, улучшила эффективность и добавила уведомления. Пользователям рекомендуют Sonnet 4.6 вместо Opus, отключение Extended Thinking и свежие сессии.
Alibaba собирает ИИ-направления в Token Hub под прямым руководством CEO Эдди Ву, включая команды Qwen, DingTalk и устройства Quark. Это поможет ускорить монетизацию ИИ и представить агента для бизнеса с интеграцией в Taobao и Alipay. Китайским компаниям сложнее зарабатывать из-за скепсиса пользователей к платным сервисам.
Stripe анонсировала функцию биллинга, которая позволяет ИИ-стартапам автоматически добавлять маржу до 30% к затратам на токены LLM и передавать их клиентам. Инструмент отслеживает цены API моделей и совместим с шлюзами вроде Vercel и OpenRouter. Это решает проблему убытков от неконтролируемого потребления токенов в агентских приложениях.
GitHub Copilot с июня 2026 года перейдет на оплату по токенам через GitHub AI Credits вместо подсчета премиум-запросов. Цены тарифов останутся прежними, автодополнение кода не будет тратить кредиты, бизнесу дадут бонусы на переход. Марио Родригес объяснил это разными затратами на агентные задачи, тестовые счета запустят в мае.
Разработчики хвастаются большими бюджетами токенов для ИИ-кодинга, но данные показывают высокий churn: 80–90% одобрения падает до 10–30% из-за правок. Компании вроде Waydev, GitClear, Faros AI и Jellyfish фиксируют рост объема кода, но не его качества — junior инженеры страдают сильнее.
Нулевые простои для ИИ-агентов требуют не только работающей инфраструктуры, но и стабильного поведения, контроля затрат и качества решений. Статья описывает трехуровневую модель доступности: инфраструктура, оркестрация и уровень агента, с адаптацией стратегий развертывания вроде голубой-зеленых и канареек. Наблюдаемость поведения, задержек и токенов — ключ к безопасным обновлениям без потери доверия пользователей.
Гендиректор Nvidia Дженсен Хуанг заявил, что разработчик с зарплатой $500 тысяч в год должен тратить на ИИ-токены минимум $250 тысяч, иначе это вызывает тревогу. Он сравнил такую экономию с отказом от профессиональных CAD-инструментов. Прогнозы Anthropic по доходам от ИИ в сотни миллиардов долларов к 2028 году Хуанг назвал консервативными.
Anthropic отменила надбавку за контекстные окна свыше 200 тысяч токенов в Claude Opus 4.6 и Sonnet 4.6, сделав миллион токенов доступным по стандартным ценам 5/25 и 3/15 долларов за миллион. Лимит на изображения и PDF вырос до 600 за запрос, новые тарифы работают в Claude Code и через облачные платформы. Модели лидируют по точности на полном контексте, хотя общие проблемы с длинными промптами сохраняются.
Показаны все статьи (11)