Токены

14 публикаций по теме

Токены

Microsoft переводит Copilot Cowork на оплату по факту и может внедрить DeepSeek

Microsoft меняет тарифную модель Copilot Cowork, переходя от фиксированной платы к оплате за использование. Рассматривается внедрение дообученной модели DeepSeek V4 как более дешёвой альтернативы Claude, размещённой в Azure. Решение призвано сдержать растущие затраты на агентные ИИ-задачи.

1 мин

18 июня 2026 г.

Статьи

Бенчмарки LLM от DataRobot: что важно знать перед развертыванием

DataRobot представил стандартизированные бенчмарки для LLM, измеряющие реальную производительность: максимальную конкурентность, задержку и стоимость токенов. Эти метрики позволяют точно рассчитать бюджет и инфраструктуру до запуска в продакшн.

4 мин

27 мая 2026 г.

Новости

GitHub Copilot перейдет на оплату по токенам в июне 2026

GitHub Copilot с июня 2026 года перейдет на оплату по токенам через GitHub AI Credits вместо подсчета премиум-запросов. Цены тарифов останутся прежними, автодополнение кода не будет тратить кредиты, бизнесу дадут бонусы на переход. Марио Родригес объяснил это разными затратами на агентные задачи, тестовые счета запустят в мае.

1 мин

28 апреля 2026 г.

Новости

«Tokenmaxxing» делает разработчиков менее продуктивными

Разработчики хвастаются большими бюджетами токенов для ИИ-кодинга, но данные показывают высокий churn: 80–90% одобрения падает до 10–30% из-за правок. Компании вроде Waydev, GitClear, Faros AI и Jellyfish фиксируют рост объема кода, но не его качества — junior инженеры страдают сильнее.

4 мин

17 апреля 2026 г.

Статьи

Обновления ИИ-агентов без простоев в крупных развертываниях

Нулевые простои для ИИ-агентов требуют не только работающей инфраструктуры, но и стабильного поведения, контроля затрат и качества решений. Статья описывает трехуровневую модель доступности: инфраструктура, оркестрация и уровень агента, с адаптацией стратегий развертывания вроде голубой-зеленых и канареек. Наблюдаемость поведения, задержек и токенов — ключ к безопасным обновлениям без потери доверия пользователей.

14 мин

7 апреля 2026 г.

Новости

Дженсен Хуанг встревожен расходами на ИИ-токены

Гендиректор Nvidia Дженсен Хуанг заявил, что разработчик с зарплатой $500 тысяч в год должен тратить на ИИ-токены минимум $250 тысяч, иначе это вызывает тревогу. Он сравнил такую экономию с отказом от профессиональных CAD-инструментов. Прогнозы Anthropic по доходам от ИИ в сотни миллиардов долларов к 2028 году Хуанг назвал консервативными.

2 мин

21 марта 2026 г.

Новости

Anthropic убрала доплату за миллион токенов в Claude

Anthropic отменила надбавку за контекстные окна свыше 200 тысяч токенов в Claude Opus 4.6 и Sonnet 4.6, сделав миллион токенов доступным по стандартным ценам 5/25 и 3/15 долларов за миллион. Лимит на изображения и PDF вырос до 600 за запрос, новые тарифы работают в Claude Code и через облачные платформы. Модели лидируют по точности на полном контексте, хотя общие проблемы с длинными промптами сохраняются.

2 мин

13 марта 2026 г.

Новости

Сатья Наделла: «Я токен-максер, это затягивает» — CEO Microsoft о будущем ИИ и программирования

Глава Microsoft Сатья Наделла предупреждает, что необдуманное использование мощнейших ИИ-моделей для повседневных задач — «токен-максинг» — не приведёт к реальному экономическому росту. При этом он признаётся, что сам подвержен зависимости от таких моделей. Также Наделла предсказывает, что разработчики перестанут писать код, а будут управлять сотнями ИИ-агентов, и ключевым навыком станет «когнитивное покрытие» — глубокое понимание написанного агентами кода.

1 мин

15 июня 2026 г.

Новости

GitHub Copilot переходит на оплату по токенам

GitHub Copilot меняет модель оплаты: вместо лимита запросов вводятся кредиты ИИ по центу за штуку, где расход зависит от токенов. Pro-тариф даёт 1000 кредитов в месяц, автодополнение и Next Edit остаются без платы.

2 мин

1 мая 2026 г.

Новости

Opus 4.7 от Anthropic тратит до 47% больше токенов

Opus 4.7 от Anthropic имеет равную с 4.6 цену, но расходует больше токенов — в среднем 1,325 раза на коде, до 1,47 раза на техдокументах и 37,4% по данным сообщества. Для сессии из 80 взаимодействий затраты вырастут на 20–30%. Модель лучше следует инструкциям — на 5 п.п. по IFEval.

2 мин

19 апреля 2026 г.

Статьи

Агентный ИИ обходится дороже, чем вы планировали

Агентный ИИ выходит за рамки запланированных бюджетов из-за операционных расходов на эксплуатацию, управление и масштабирование. Проекты часто проваливаются при переходе в производство из-за неучтенных факторов вроде потребления токенов, неэффективности GPU и пробелов в governance. Стратегии вроде модульных фреймворков, serverless-инфраструктуры и автоматизированного мониторинга помогают контролировать затраты.

14 мин

14 апреля 2026 г.

Новости

Anthropic объяснила быстрый расход лимитов Claude Code

Anthropic разобралась с жалобами на быстрый расход лимитов в Claude Code: виноваты пиковые ограничения и растущие контексты до 1 млн токенов. Компания исправила баги, улучшила эффективность и добавила уведомления. Пользователям рекомендуют Sonnet 4.6 вместо Opus, отключение Extended Thinking и свежие сессии.

Alibaba объединяет ИИ-направления в Token Hub под CEO

Alibaba собирает ИИ-направления в Token Hub под прямым руководством CEO Эдди Ву, включая команды Qwen, DingTalk и устройства Quark. Это поможет ускорить монетизацию ИИ и представить агента для бизнеса с интеграцией в Taobao и Alipay. Китайским компаниям сложнее зарабатывать из-за скепсиса пользователей к платным сервисам.

1 мин

16 марта 2026 г.

Новости

Stripe превращает расходы на ИИ в источник прибыли

Stripe анонсировала функцию биллинга, которая позволяет ИИ-стартапам автоматически добавлять маржу до 30% к затратам на токены LLM и передавать их клиентам. Инструмент отслеживает цены API моделей и совместим с шлюзами вроде Vercel и OpenRouter. Это решает проблему убытков от неконтролируемого потребления токенов в агентских приложениях.

2 мин

3 марта 2026 г.

Показаны все статьи (14)

Токены

Microsoft переводит Copilot Cowork на оплату по факту и может внедрить DeepSeek

Бенчмарки LLM от DataRobot: что важно знать перед развертыванием

GitHub Copilot перейдет на оплату по токенам в июне 2026

«Tokenmaxxing» делает разработчиков менее продуктивными

Обновления ИИ-агентов без простоев в крупных развертываниях

Дженсен Хуанг встревожен расходами на ИИ-токены

Anthropic убрала доплату за миллион токенов в Claude

Сатья Наделла: «Я токен-максер, это затягивает» — CEO Microsoft о будущем ИИ и программирования

GitHub Copilot переходит на оплату по токенам

Opus 4.7 от Anthropic тратит до 47% больше токенов

Агентный ИИ обходится дороже, чем вы планировали

Anthropic объяснила быстрый расход лимитов Claude Code

Alibaba объединяет ИИ-направления в Token Hub под CEO

Stripe превращает расходы на ИИ в источник прибыли

Сейчас в тренде

Популярные темы