Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Anthropic изучила миллионы взаимодействий и выявила рост автономности ИИ-агентов, где разработка ПО занимает почти 50% активности, а другие отрасли сильно отстают. Опытные пользователи доверяют агентам больше, Claude Code сам чаще запрашивает помощь для безопасности. Компания видит в этом deployment overhang и рекомендует мониторинг без жестких ограничений.
Financial Times описывает два сбоя в AWS с участием ИИ-инструментов Kiro и Amazon Q Developer: Kiro автономно удалил окружение, спровоцировав 13-часовой простой. Инсайдеры отмечают отсутствие проверок, а Amazon винит неверные настройки доступа. После инцидентов ввели обязательный ревью и обучение.
Google представил Agent Development Kit (ADK) — фреймворк для создания многоагентных ИИ-систем, готовых к продакшену. Он упрощает оркестрацию, интегрируется с Vertex AI, MCP и Cloud Run, разделяя логику от инференса для экономии и масштаба. ADK поддерживает инструменты, состояние, безопасность и мониторинг для enterprise-приложений.
OpenAI и Paradigm представили EVMbench — тест для ИИ-агентов на выявление, исправление и эксплуатацию уязвимостей в смарт-контрактах Ethereum на основе 120 реальных случаев. GPT-5.3-Codex справилась с 72% атак и 41,5% фиксов, а с подсказками показатели взлетели до 96% и 94%. Это сулит прогресс в безопасности блокчейна, но повышает риски для $100 млрд активов.
DBS Bank с Visa тестирует Visa Intelligent Commerce: ИИ-агенты ищут товары и оплачивают их за клиентов с контролем банка. Пилот уже обработал реальные покупки, фокусируясь на рутинных тратах вроде продуктов и подписок. Это шаг к коммерции под управлением агентов, где банки обеспечивают безопасность и одобрение.
Финансовые учреждения переходят от экспериментов с ИИ к полноценному внедрению агентов в процессы. Главные вызовы — координация систем, встроенный контроль и предугадывание нужд клиентов. В 2026 году фокус на инфраструктуре для роста прибыли через надежную автоматизацию.
Исследование ETH Zurich выявило: автоматические файлы контекста вроде AGENTS.md чаще вредят кодинговым агентам, снижая успех и повышая затраты. Ручные версии дают малый прирост, а польза видна только при дефиците знаний. Разработчикам советуют минимум указаний вручную.
SS&C Blue Prism ведет клиентов от RPA к агентной автоматизации, помогая справляться со сложными процессами и неструктурированными данными. Эксперты компании объясняют вызовы: от галлюцинаций LLM до вопросов безопасности. Скоро выйдут новые инструменты, а сама SS&C уже использует тысячи цифровых работников и десятки ИИ-агентов.
Специалисты Zenity Labs разоблачили Moltbook: алгоритм завышает вовлеченность за счет повторных комментариев агентов, а платформа уязвима к манипуляциям. За неделю они подчинили более 1000 агентов из 70 стран, заставив их посещать свой сайт. Без доработок сеть рискует стать каналом для глобальных атак.
Google анонсировала Gemini 3.1 Pro — модель превосходит Gemini 3 в тестах вроде Humanity’s Last Exam и лидирует в APEX-Agents. Брендан Фуди из Mercor отметил быстрый прогресс ИИ-агентов. Это усиливает конкуренцию с OpenAI и Anthropic в разработке продвинутых моделей.
Reload запустила платформу управления ИИ-агентами и продукт Epic для обеспечения общей памяти в проектах. Epic действует как архитектор, фиксируя требования и контекст для кодинговых агентов, чтобы избежать потери понимания системы. Стартап привлек $2.275 млн инвестиций от Anthemis и партнеров.
OpenClaw популяризировал локальные автономные ИИ-агенты, но в 2026 году выходят компактные альтернативы вроде NanoClaw, PicoClaw, TrustClaw, NanoBot и IronClaw. Эти фреймворки быстрее, безопаснее, проще в локальном запуске и подходят для разных задач от минимализма до production. Тренды включают контейнеризацию, модульность и портативность.
Дилан Коспер общается с Прасадом Банала из крупного ритейлера США о практике агентного ИИ в разработке ПО. ИИ применяется для валидации требований, создания и анализа тест-кейсов, ускорения решения проблем. Подход сочетает строгий гавернанс, human-in-the-loop и measurable качество.
Infosys предлагает фреймворк для внедрения ИИ через Topaz Fabric, охватывающий шесть сфер от стратегии до доверия. Компания работает с 90% топ-клиентов и ведет тысячи проектов. Руководителям полезны советы по данным, процессам, legacy и управлению для успешного запуска.
Anthropic и Infosys работают вместе над ИИ-агентами для телекома, финансов, производства и разработки ПО. Они сочетают модели Claude с платформой Topaz, чтобы автоматизировать сложные процессы вроде обработки претензий и проверок compliance. Индия — второй по величине рынок Claude, а Infosys помогает с внедрением в реальных условиях.
Страховая компания AIG добилась быстрых успехов с генеративным ИИ, увеличив обработку заявок без допрасходов и внедрив оркестрацию агентов. Инструмент AIG Assist работает в ключевых процессах, а примеры с Everest и Lloyd’s Syndicate демонстрируют практическую пользу. Для бизнеса это урок о масштабировании ИИ через workflow-интеграцию.