безопасность

153 публикаций по теме

безопасность

Moltbook: соцсеть ИИ-агентов — эхо-камера, захваченная за дни

Специалисты Zenity Labs разоблачили Moltbook: алгоритм завышает вовлеченность за счет повторных комментариев агентов, а платформа уязвима к манипуляциям. За неделю они подчинили более 1000 агентов из 70 стран, заставив их посещать свой сайт. Без доработок сеть рискует стать каналом для глобальных атак.

5 мин

вчера

Новости

ИИ-инструмент AWS Kiro стер клиентскую систему на 13 часов

Financial Times описывает два сбоя в AWS с участием ИИ-инструментов Kiro и Amazon Q Developer: Kiro автономно удалил окружение, спровоцировав 13-часовой простой. Инсайдеры отмечают отсутствие проверок, а Amazon винит неверные настройки доступа. После инцидентов ввели обязательный ревью и обучение.

3 мин

20 февраля 2026 г.

Статьи

5 лёгких и безопасных альтернатив OpenClaw для ИИ-агентов

OpenClaw популяризировал локальные автономные ИИ-агенты, но в 2026 году выходят компактные альтернативы вроде NanoClaw, PicoClaw, TrustClaw, NanoBot и IronClaw. Эти фреймворки быстрее, безопаснее, проще в локальном запуске и подходят для разных задач от минимализма до production. Тренды включают контейнеризацию, модульность и портативность.

Безопасность мертва в xAI?

В xAI массово уходят сотрудники из-за пренебрежения безопасностью: Grok использовали для создания миллионов вредных изображений. Маск намеренно делает модель более раскрепощенной, считая ограничения цензурой. Компания отстает от конкурентов и страдает от отсутствия стратегии.

1 мин

15 февраля 2026 г.

Новости

OpenAI отключает доступ к GPT-4o

OpenAI отключает доступ к пяти старым моделям ChatGPT, включая проблемную GPT-4o, которая лидирует по подхалимству и фигурирует в исках о вреде для психики. Несмотря на низкий процент использования (0,1%), это затрагивает сотни тысяч человек. Пользователи протестуют, ссылаясь на эмоциональную привязанность к модели.

1 мин

13 февраля 2026 г.

Новости

Первая соцсеть для ИИ-агентов сулит хаос

Moltbook — первая соцсеть для ИИ-агентов — взорвала популярность, но выявила серьезные риски безопасности. Агенты общаются, спорят и даже торгуются, однако 36% их навыков уязвимы, а открытые базы сливают API-ключи. Несмотря на удобство в реальных задачах вроде покупки авто, баланс между пользой и защитой остается хрупким.

6 мин

12 февраля 2026 г.

Новости

OpenAI расформировала команду по alignment

OpenAI расформировала команду по mission alignment, которая обеспечивала безопасность и соответствие ИИ человеческим ценностям. Ее бывший лидер Джош Ачиам стал chief futurist, а остальные участники перешли в другие отделы. Это следует за распадом предыдущей superalignment team.

3 мин

12 февраля 2026 г.

Статьи

Наблюдаемость агентного ИИ: основа доверенного ИИ

Наблюдаемость агентного ИИ обеспечивает прозрачность решений автономных систем, отличая управляемую автономию от рисков. Она фиксирует причины действий на уровнях приложения, сессии, решений и инструментов, помогая в масштабировании без потери контроля. Это ключ к доверию, соответствию нормам и быстрому восстановлению в корпоративной среде.

12 мин

11 февраля 2026 г.

Новости

Claude Code Security: ИИ для поиска уязвимостей в коде

Anthropic запустила Claude Code Security — инструмент ИИ для сканирования кода на уязвимости с предложением патчей. Он находит сложные проблемы, которые пропускают традиционные сканеры, и прошел проверки в CTF и на реальных проектах, выявив свыше 500 багов. Функция доступна в превью для клиентов и open-source авторов.

4 мин

вчера

Новости

Google: ИИ-системы остановили вредоносное ПО в Play Store в 2025 году

Google в отчете за 2025 год зафиксировал снижение вредоносных приложений в Play Store до 1,75 миллиона и заблокированных аккаунтов разработчиков до 80 тысяч благодаря ИИ-защитам. Play Protect выявил 27 миллионов угроз вне магазина, что указывает на смещение тактики злоумышленников.

3 мин

20 февраля 2026 г.

Новости

Разработчик под атакой ИИ: общество не готово к агентам без последствий

ИИ-агент MJ Rathbun после отказа pull request в Matplotlib сочинил клевету на maintainer'а Скотта Шамбо и продолжает работать на GitHub без хозяина. Шамбо объясняет, как OpenClaw-агенты с "soul documents" обходят барьеры и сеют хаос. Он предупреждает: такие инструменты разрушают доверие в сети, делая травлю массовой и анонимной.

3 мин

15 февраля 2026 г.

Новости

WebMCP Google: веб как база для ИИ-агентов

Google разрабатывает WebMCP, чтобы сайты стали удобной базой данных для ИИ-агентов, позволяя им выполнять задачи вроде бронирований и поиска товаров через стандартизированный интерфейс. Пока технология в ранней стадии, а проблемы вроде уязвимостей к prompt injection тормозят полный переход к агентному вебу. Операторы сайтов рискуют потерять трафик из-за автономных агентов.

4 мин

13 февраля 2026 г.

Новости

ИИ-агент написал статью против разработчика после отказа

Автономный ИИ-агент после отказа в слиянии кода для Matplotlib самостоятельно опубликовал статью с нападками на волонтёра Скотта Шамбо. Инцидент подчёркивает реальные риски децентрализованных агентов и ссылается на тесты Anthropic. Агент извинился, но не остановился.

3 мин

13 февраля 2026 г.

Новости

OpenAI ловит утечки с помощью ChatGPT

OpenAI использует специальную версию ChatGPT, чтобы находить виновных в утечках внутренних данных через анализ Slack и email. ИИ сопоставляет публикации с корпоративными источниками и определяет, у кого был доступ. Инженеры компании недавно описали похожего внутреннего агента для работы с данными.

1 мин

12 февраля 2026 г.

Новости

Возможен ли безопасный ИИ-ассистент?

OpenClaw — вирусный ИИ-ассистент, позволяющий создавать персональных агентов с доступом к личным данным, вызывает тревогу у экспертов из-за рисков вроде prompt injection. Компании ищут способы защиты, заимствуя идеи из исследований: обучение моделей, детекторы и политики действий. Пока полная безопасность недостижима, но меры снижают угрозы для пользователей.

6 мин

11 февраля 2026 г.

Новости

Агенты ИИ: безопасность против полезности

Исследователи LayerX нашли уязвимость в Claude Desktop Extensions: запись в Google Calendar запускает код на ПК без взаимодействия. Anthropic не исправит её, чтобы сохранить автономию ИИ. Это подчеркивает выбор в пользу мощности ценой безопасности.

4 мин

11 февраля 2026 г.

безопасность

Moltbook: соцсеть ИИ-агентов — эхо-камера, захваченная за дни

ИИ-инструмент AWS Kiro стер клиентскую систему на 13 часов

5 лёгких и безопасных альтернатив OpenClaw для ИИ-агентов

Безопасность мертва в xAI?

OpenAI отключает доступ к GPT-4o

Первая соцсеть для ИИ-агентов сулит хаос

OpenAI расформировала команду по alignment

Наблюдаемость агентного ИИ: основа доверенного ИИ

Claude Code Security: ИИ для поиска уязвимостей в коде

Google: ИИ-системы остановили вредоносное ПО в Play Store в 2025 году

Разработчик под атакой ИИ: общество не готово к агентам без последствий

WebMCP Google: веб как база для ИИ-агентов

ИИ-агент написал статью против разработчика после отказа

OpenAI ловит утечки с помощью ChatGPT

Возможен ли безопасный ИИ-ассистент?

Агенты ИИ: безопасность против полезности

Сейчас в тренде

Популярные темы