Студент-медик Зевс из города на холмах в центральной Нигерии возвращается в свою небольшую квартиру после долгого дня в больнице. Он включает кольцевую лампу, закрепляет iPhone на лбу и начинает себя снимать. Поднимает руки перед собой, словно сомнамбула, накидывает простыню на кровать. Движется неторопливо и аккуратно, чтобы ладони оставались в кадре камеры.
Зевс работает оператором данных для американской компании Micro1 из Пало-Альто в Калифорнии. Она собирает реальные данные и продает их производителям роботов. Пока Tesla, Figure AI и Agility Robotics соревнуются в создании гуманоидных роботов — машин, похожих на людей по форме и движениям для фабрик и домов, — видео от таких гиг-работников, как Зевс, превратились в самый востребованный способ их обучения.
Micro1 наняла тысячи подрядчиков в свыше 50 стран, включая Индию, Нигерию и Аргентину. Там много молодых людей, владеющих техникой и ищущих работу. Они крепят iPhone к голове и снимают, как складывают белье, моют посуду или готовят еду. По местным меркам оплата щедрая и помогает экономикам регионов, но возникают острые вопросы о приватности и осознанном согласии. Работа иногда бывает сложной и странной.
Зевс наткнулся на вакансию в ноябре, когда о ней заговорили в LinkedIn и YouTube. "Это отличный шанс оставить след и предоставить данные для будущих роботов", — решил он.
Ему платят 15 долларов в час — солидно для Нигерии с высоким уровнем безработицы. Но амбициозный студент, мечтающий о карьере врача, устает от глажки одежды часами.
"Мне это не очень нравится, — признается он. — Я люблю задачи, где нужно думать".
Зевс и другие работники, с которыми беседовали, просили использовать псевдонимы, поскольку не имели права обсуждать занятость.
Создать гуманоидных роботов сложно: манипуляции с предметами требуют мастерства. Появление больших языковых моделей для чат-ботов вроде ChatGPT изменило подход в робототехнике. Как эти модели научились генерировать текст на огромных массивах интернет-данных, так и гуманоиды могут освоить взаимодействие с миром через гигантские объемы видео о движениях.
Робототехника требует сложных данных о реальности, которые трудно добыть. Симуляции помогают роботам выполнять акробатику, но не схватывать и перемещать вещи — физика моделируется неточно. Для фабрик и уборки в домах нужны настоящие записи, пусть сбор и обходится дорого.
Инвесторы активно вкладывают в решение проблемы: в 2025 году на гуманоидов ушло свыше 6 миллиардов долларов. Запись данных дома становится глобальным гиг-экономикой. Scale AI и Encord собирают своих операторов, DoorDash платит курьерам за съемку бытовых дел. В Китае на госучреждениях работники в VR-шлемах и экзоскелетах учат роботов открывать микроволновку и протирать стол.
"Спрос огромный и растет стремительно", — говорит Али Ансари, глава Micro1. По его оценке, робототехнические фирмы тратят ежегодно свыше 100 миллионов долларов на такие реальные данные у него и конкурентов.
Один день из жизни
Кандидатов в Micro1 проверяет ИИ-агент Zara: она проводит собеседования и смотрит пробные видео бытовых дел. Еженедельно подрядчики сдают ролики домашних задач по списку правил — руки в кадре, естественная скорость. Проверяют ИИ и человек, одобряют или отклоняют. Потом ИИ и сотни аннотаторов маркируют действия.
"Спрос огромный и растет стремительно".
Али Ансари, глава Micro1
Метод обучения новичок, так что идеальные данные еще неясны. Но "нужны тысячи вариаций, чтобы роботы хорошо ориентировались и манипулировали предметами", — объясняет Ансари.
Подрядчики жалуются: в маленьких квартирах трудно выдумывать разнообразие. Зевс в скромной студии повторяет глажку. Арджун, репетитор из Дели, тратит час на 15-минутный ролик — думает над новыми делами.
"Сколько контента можно снять дома? Сколько?" — вопрошает он.
Приватность — больная тема. Micro1 просит не показывать лица и личные данные вроде имен, номеров, дат рождения. ИИ и ревьюеры удаляют утечки.
Но без лиц видео фиксируют личное: интерьеры, вещи, распорядок. Пока работники заняты делами на камеру, трудно уследить за чувствительной инфой помимо явных маркеров.
Семьянам сложнее прятать личное. Арджун, отец двух дочек, выгоняет двухлетку из кадра. "Иногда невозможно работать — дочка маленькая", — вздыхает он.
Саша, экс-банкир из Нигерии, на цыпочках вешает белье во дворе жилкомплекса, чтобы не заснять соседей, которые глазеют в недоумении.
"Это займет больше времени, чем кажется".
Кен Голдберг, Университет Калифорнии в Беркли
Работники понимают: данные идут на роботов. Но никто не знает деталей использования, хранения, передачи третьим лицам, включая покупателей Micro1. Из соображений конфиденциальности клиенты анонимны, цели проектов не раскрывают.
"Компании обязаны информировать работников о целях, куда ведут технологии и как это скажется на них в будущем", — подчеркивает Ясмин Коттури, специалист по человекоцентричным вычислениям из Университета Мэриленда.
Бывают вопросы в Slack о стирании данных. Micro1 не комментирует удаление.
"Люди сами выбирают эту работу и могут бросить когда угодно", — парирует Ансари.
Жажда данных
Робототехники сомневаются: данные от тысяч людей в разных домах надежны ли для безопасного обучения?
"Дома мы не всегда действуем безопасно, — отмечает Аарон Прейтер из ASTM International. — Плохие привычки могут привести к авариям, такие данные вредны". Объем усложняет контроль. Ансари уверяет: опасные видео отвергают, неуклюжие полезны — учат, чего избегать.
Сколько данных хватит? Micro1 собрала десятки тысяч часов, Scale AI — свыше 100 тысяч.
"Дорога долгая, — прогнозирует Кен Голдберг из Университета Калифорнии в Беркли. — Языковые модели жрали текст на 100 тысяч лет чтения человеком, роботам нужно больше: суставы сложнее слов. Это займет больше времени, чем кажется".
Датту, студент-инженер из индийского технохаба, после лекций мчится на тесный балкон с горшками и гантелями. Пропускает ужин, пристегивает iPhone ко лбу и мнет одну пачку белья раз за разом.
Родные таращатся в изумлении. "Для них это космическая техника", — смеется он. Друзья в шоке: "Платят за съемку дел по дому?!"
Совмещать учебу, запись и другие аннотации утомляет. Но "ощущение, что делаешь нечто уникальное для мира", — компенсирует.