Conlang Crafter: ИИ-модель для генерации искусственных языков

Модель ИИ Conlang Crafter способна генерировать новые искусственные языки строго соблюдая заданные правила Она превосходит обычные большие языковые модели по разнообразию вдвое а по согласованности почти на 70 % Разработчики планируют использовать её для проверки гипотезы Сепира‑Уорфа.

Сегодня насчитывается более 7 000 естественных языков, однако это не останавливает людей от создания совершенно новых – искусственных конструктов (conlangs). Самые известные примеры – дотракийский, клингонский и эльфийские языки. Теперь этим занялся искусственный интеллект – модель Conlang Crafter умеет порождать новые языки и делает это весьма успешно.

В статье, опубликованной 27 июня в трудах Ассоциации компьютерной лингвистики (Proceedings of ACL), исследователи проанализировали способности модели к генерации языков и сообщили: она способна разрабатывать самые разные новые языки, неизменно соблюдая их внутренние правила.

Как Conlang Crafter создаёт новые языки

Ранее Гашпер Бегуш, адъюнкт‑профессор лингвистики Калифорнийского университета в Беркли (UC Berkeley), показал способность больших языковых моделей (LLM) анализировать естественные языки почти так же хорошо, как человек. В новой работе он решил расширить границы возможностей ИИ.

«Создать целый язык – совсем непростая задача», – отмечает Бегуш напоминая что некоторые лингвисты посвящают целую карьеру разработке конлангов для фильмов книг видеоигр.

Однако Бегуш видит дополнительную ценность в том чтобы научить модели ИИ придумывать по‑настоящему новые языки – такие которые человеку даже не пришли бы в голову «Модели способны вообразить или создать то чего мы не можем мы можем многому у них научиться» – говорит он.

Например Conlang Crafter может порождать языки с нетривиальными системами коммуникации – скажем язык для головоногих моллюсков использующий цвета жесты вместо звуков Разумеется этот «цветовой язык» не является настоящим средством общения осьминогов однако Бегуш видит такие вымышленные языки инструментом для детального изучения нечеловеческих форм коммуникации.

Бегуш вместе с коллегами – Моррисом Альпером постдоком Университета Карнеги‑Меллон (CMU) Моран Янкуа аспирантом Тель‑Авивского университета – спроектировал модель так чтобы она могла применять широкий спектр лингвистических правил касающихся организации звуков (фонология) связи между словами предложениями (морфосинтаксис) лексики.

Генератор случайных чисел регулярно добавляет вариативность благодаря чему каждый новый язык получается уникальным Встроенный цикл редактирования затем проверяет результат на противоречия исправляет их Пользователь может выбрать любой набор правил либо попросить модель придумать их самостоятельно.

«Модели способны вообразить или создать то чего мы не можем мы можем многому у них научиться».
— Гашпер Бегуш Калифорнийский университет Беркли

«Вы можете выбрать любой “вкус” языка какой захотите – говорит Бегуш – Например создать смесь японского эсперанто».

«Цель чтобы языки были креативными поэтому они должны отличаться друг от друга – поясняет Альпер специализирующийся на мультимодальном машинном обучении компьютерной лингвистике – Также они должны быть непротиворечивыми потому что язык это система правил которые не должны конфликтовать между собой».

Для оценки разнообразия команда измеряла степень различия между полученными языками по ключевым признакам – например базовому порядку слов Для оценки согласованности проверяли правильно ли переводы на каждый вымышленный язык следуют его собственным правилам.

Исследователи сравнили результаты работы модели с языками созданными универсальными LLM такими как Gemini‑2 5‑Pro. «Наша полная система примерно вдвое разнообразнее почти на 70 % более согласованна чем простой запрос к большой языковой модели придумать новый язык» – сообщает Альпер.

Conlang Crafter в обработке естественного языка

Дэвид Мортенсен, доцент‑исследователь Института языковых технологий Университета Карнеги‑Меллон не принимавший участия работе считает что инструмент может помочь специалистам по NLP лучше оценивать влияние структуры языка производительность моделей.

«Существует множество исследований указывающих что лингвистическая структура – как этапе обучения так тестирования – действительно влияет качество работы модели – говорит Мортенсен – Однако проверить соответствующие гипотезы было очень сложно». Он добавляет что такой инструмент как Conlang Crafter позволит проводить эксперименты эффектами типологии лексики научно обоснованном надёжном ключе.

Модель доступна бесплатно онлайн. Создатели отмечают что система пока ограничена более сложных лингвистических измерениях – семантике контекстуальном использовании языка визуальных аспектах письменности.

Бегуш планирует расширить исследование проверить гипотезу Сепира‑Уорфа, согласно которой язык влияет мышление восприятие мира Например можно запустить симуляции разных миров каждый со своим собственным языком проследить влияние общество «Это был бы хороший следующий шаг» – заключает он.

Conlang Crafter: ИИ-модель для генерации искусственных языков

Как Conlang Crafter создаёт новые языки

Conlang Crafter в обработке естественного языка

Горячее

Seedance 2.5 от ByteDance: ИИ-видео до 30 секунд без склеек

Adobe добавила ИИ-агентов в Photoshop Premiere

Subquadratic утверждает, что решила ключевую проблему больших языковых моделей

Всё больше людей узнают новости от ИИ-чатботов, но доверие остаётся низким

Cursor анонсировал ИИ-модель, Origin и мобильное приложение

Сейчас в тренде