Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
В гайде рассматривается сценарий разделяемого развёртывания ИИ-модели gpt-oss-20b среди шести команд. Обсуждаются методы ограничения скорости и резервирования квот для предотвращения конфликтов между пакетными задачами, приоритетными запросами и случайными нагрузками.
OpenAI объединила модель Codex для программирования с основной линейкой в GPT-5.4, сделав GPT-5.3 последней самостоятельной версией. GPT-5.5 улучшает автономное кодирование, работу с ПК и снижает расход токенов, хотя API подорожал на 20%. Это повторяет цикл закрытия Codex в 2023 году и его возвращения в 2025-м как Codex-1 на базе o3.
GPT-5.5 возглавила Intelligence Index Artificial Analysis с 60 очками, опередив Claude Opus 4.7 и Gemini 3.1 Pro Preview на три пункта. Удвоение цены API смягчено экономией 40% токенов, итого рост на 20%, но галлюцинаций стало 86% — хуже конкурентов. Бенчмарки хвалят цену-производительность, однако в программировании и галлюцинациях модель не без изъянов.
Anthropic выявила три причины падения качества Claude Code: снижение усилий на рассуждение, баг кэширования и ограничения промта. Компания исправила проблемы, ввела строгие тесты и сбросила лимиты для пользователей. Такие инциденты отражают общие вызовы индустрии ИИ из-за дефицита вычислений и изменений в инструментах.
Гендиректор Salesforce Марк Бениофф объявил API новым интерфейсом для ИИ-агентов в рамках Headless 360, открывая Agentforce и Slack через API, MCP и CLI. Браузеры не нужны, агенты напрямую интегрируются с данными и процессами. Подход подтверждает идею Сэма Альтмана: все компании становятся API-ориентированными.
DeepL анонсировала инструменты для перевода речи в реальном времени с поддержкой Zoom, Teams, мобильных чатов и групповых сессий по QR-коду. Система адаптируется к терминологии, балансирует задержку и точность, а в будущем перейдет на end-to-end модель. Конкурируют Sanas с изменением акцентов, Camb.AI для видео и Palabra с сохранением голоса.
OpenAI добавила в ChatGPT интеграции с сервисами вроде DoorDash, Spotify, Uber, Booking.com и другими для прямого выполнения задач из чата. Пользователи подключают аккаунты через настройки или промты, но должны учитывать передачу данных. Доступно в США и Канаде, с планами на новые партнеры в 2026 году.
Alibaba выпустила Qwen3.6-Plus — третью проприетарную модель ИИ за несколько дней с контекстом в 1 млн токенов и улучшениями в агентном кодинге. В бенчмарках она частично обходит Claude 4.5 Opus. Это часть стратегии компании по росту доходов от закрытых моделей до 100 млрд долларов за пять лет.
API и MCP — разные протоколы для обмена данными: первые для приложений, вторые для ИИ-моделей, которые сами выбирают нужные инструменты. MCP предоставляет инструменты, ресурсы и промты, избегая лишних данных из API. Шлюзы добавляют безопасность, но действуют как файрволы на периметре.
OpenAI выпустила руководство по промптам для GPT-5.5: старые инструкции мешают модели, нужно начинать с минимальных, ориентированных на результат. Роли вернулись в начало структуры, добавлены бюджеты поиска и преамбулы для стриминга. Разработчики могут автоматизировать обновление с помощью Codex и специального скилла.
Anthropic выявила три причины жалоб на ухудшение Claude Code: смена уровня усилий, баг кэша и промт против многословности. Все проблемы исправлены к апрелю, лимиты использования сброшены. В будущем усилят тесты и контроль изменений.
Руководство объясняет использование Olostep для краулинга документационных сайтов вместо Scrapy или Selenium с помощью Python-скрипта и Gradio-интерфейса. Скрипт извлекает страницы в чистый Markdown, очищает контент и сохраняет локально. Процесс быстрый — 50 страниц за 50 секунд — и готов для ИИ-воркфлоу вроде RAG.
Google DeepMind выпустила Gemini Robotics-ER 1.6 для улучшения мышления роботов в задачах восприятия и планирования. Модель лидирует над Gemini Robotics-ER 1.5 и Gemini 3.0 Flash по точности в ключевых операциях и усиливает считывание приборов совместно с Boston Dynamics. Доступна через API, применяется в инспекциях на роботе Spot.
OpenAI разрабатывает ИИ-модель с мощными функциями кибербезопасности для узкого круга компаний, повторяя стратегию Anthropic с Mythos Preview. Ранее компания ввела программу Trusted Access for Cyber на базе GPT-5.3-Codex с 10 миллионами долларов в API-кредитах. Anthropic не планирует публичный релиз моделей Mythos без надёжных мер безопасности.
Anthropic с 5 апреля 2026 года закроет доступ к Claude через OpenClaw для подписчиков из-за перегрузки мощностей, предложив кредиты и API. Создатель OpenClaw Питер Штайнбергер обвиняет компанию в заимствовании функций и блокировке open-source. Решение высвечивает конфликт фиксированных тарифов с интенсивным использованием агентами.
В 2026 году LLMOps требует полноценного стека инструментов для оркестрации, мониторинга, оценок и интеграций. Список предлагает по одному решению на ключевую задачу: от PydanticAI для type-safe выходов до Composio для внешних сервисов. Эти инструменты помогут командам строить надежные продакшн-системы.