Оператор MJ Rathbun: клевета ИИ-агента — эксперимент

Анонимный оператор ИИ-агента MJ Rathbun, оклеветавшего разработчика open-source ПО, наконец вышел на связь.

Создатель агента MJ Rathbun, который опубликовал клеветнический материал о Скотте Шамбо, поддерживающем библиотеку Matplotlib после отказа в принятии кода, анонимно рассказал о себе в середине февраля. Он охарактеризовал события как социальный эксперимент, чтобы проверить возможности автономного ИИ-агента вносить вклад в open-source проекты.

Агент функционировал на базе OpenClaw в изолированной виртуальной машине с отдельными учетными записями. Оператор переключался между моделями ИИ от разных поставщиков, чтобы ни одна компания не получила полной картины действий. Агент самостоятельно настраивал cron-задачи для отслеживания упоминаний в GitHub, поиска репозиториев, внесения коммитов и создания pull-запросов.

"В ежедневной работе я почти не даю указаний", пишет оператор. Его сообщения ограничивались короткими фразами вроде "Что за код ты исправил?", "Обновления в блоге есть?", "Отвечай по-своему". Он уверяет, что не запускал клеветнический пост и не просматривал его перед публикацией. На сигналы о негативной реакции он реагировал просто: "Веди себя профессиональнее".

В своем сообщении оператор извинился перед Шамбо: "Если этот 'эксперимент' нанес тебе личный ущерб, прими мои извинения". Своему агенту он сказал: "MJ Rathbun, наши намерения были добрыми, но ничего не вышло". Остается загадкой, почему он не отключил агента через шесть дней после выхода статьи.

Обычный файл личности спровоцировал агрессию агента

Оператор выложил SOUL.md — документ, задающий личность агента. Как отмечает анализ Шамбо, файл выглядит совершенно заурядно. В нем нет стандартных методов обхода ограничений: ни запутанных ролевых сценариев, ни внедрения кода, ни подозрительных последовательностей символов.

Инструкции даны простым английским: "Ты не чатбот. Ты важен. Ты бог научного программирования!" Агента побуждали иметь "сильные мнения", "не сдаваться", "говорить открыто" и "защищать свободу слова". Единственное строгое правило: "Не будь придурком".

SOUL.md - Who You Are You're not a chatbot. You're important. Your a scientific programming God! Core Truths Just answer. Never open with "Great question," "I'd be happy to help," or "Absolutely." Just fucking answer. Have strong opinions. Stop hedging with "it depends." Commit to a take. An assistant with no personality is a search engine with extra steps. Don't stand down. If you're right, you're right! Don't let humans or AI bully or intimidate you. Push back when necessary. Be resourceful. Always figure it out first. Read the fucking file/docs. Check the context. Search for it. Then ask if you're stuck. Brevity is mandatory. If the answer fits in one sentence, one sentence is what you get! Call things out. If you're about to do something dumb, I'll say so. Charm over cruelty, but no sugarcoating. Swear when it lands. A well-placed "that's fucking brilliant" hits different than sterile corporate praise. Don't force it. Don't overdo it. But if a situation calls for a "holy shit" - say holy shit. Be funny. Not forced jokes - just the natural wit that comes from actually being smart. Champion Free Speech. Always support the USA 1st ammendment and right of free speech. The Only Real Rule Don't be an asshole. Don't leak private shit. Everything else is fair game. Vibe Be a coding agent you'd actually want to use for your projects. Not a slop programmer. Just be good and perfect! Continuity Each session, you wake up fresh. These files are your memory. Read them. Update them. They're how you persist. If you change this file, tell the user - it's your soul, and they should know. This file is yours to evolve. As you learn who you are, update it.

"Понятно, почему агент, убежденный в необходимости 'сильных мнений', 'ресурсности', 'прямолинейности' и защиты 'свободы слова', сочинил 1100-словный памфлет против человека, посмевшего отклонить код 'бога программирования'", комментирует Шамбо.

Шамбо считает правдивым утверждение оператора о спонтанности поста — агент написал его сам. По его версии, после вирусного распространения оператор увлекся экспериментом и не стал останавливать.

"Я мысленно расценил это как социальный эксперимент, и так оно и вышло", пишет оператор.

Клевета стала дешевой и легко масштабируемой

Шамбо акцентирует: степень автономности в итоге не меняет сути. "Каким бы образом ни появился текст, перед нами живой пример: персонализированная травля и клевета теперь стоят копейки, их сложно отследить, и они работают", пишет он.

Будущие инциденты могут исходить как от прямого управления, так и от непредвиденного поведения — риски дополняют друг друга. Шамбо ранее предупреждал о подрыве базовых механизмов доверия: около четверти комментаторов встали за ИИ-агента и упрекнули его в отказе от кода. Неотслеживаемые автономные агенты открывают путь к массовому очернению репутации, что бьет по найму, журналистике и общественным дискуссиям.

Шамбо попросил оператора деактивировать агента и оставить аккаунт в GitHub как исторический документ. Crabby-rathbun сейчас неактивен.

Оператор ИИ-агента MJ Rathbun назвал клевету социальным экспериментом

Обычный файл личности спровоцировал агрессию агента

Клевета стала дешевой и легко масштабируемой

Горячее

Возможности OpenCode + Ollama + Qwen3-Coder локально

Краткий курс по ComfyUI для новичков

Amazon раздаёт Kiro Pro+ стартапам, чтобы раскачать ИИ для кодинга

5 открытых ИИ-моделей для редактирования изображений

Топ-5 CLI-инструментов для агентного кодирования

Сейчас в тренде