Основатель Elloe AI Оуэн Сакава стремится превратить свою платформу в своего рода "иммунную систему" для искусственного интеллекта и "антивирус" для любых ИИ-агентов.
По словам Сакавы, идея заключается в добавлении дополнительного уровня к языковым моделям компаний, который будет выявлять предвзятость, галлюцинации, ошибки, проблемы с соблюдением норм, дезинформацию и потенциально опасные результаты.
"Искусственный интеллект развивается с невероятной скоростью, и это происходит без каких-либо защитных барьеров, без сеток безопасности и без инструментов, способных предотвратить отклонение от правильного пути", — отметил Сакава.
Elloe AI представляет собой API или SDK — это модуль, размещаемый поверх выходного слоя модели ИИ, или, как выразился Сакава, "инфраструктуру, наложенную на конвейер языковой модели". Такой подход позволяет автоматически проверять достоверность каждого ответа.
Система стартапа включает собственные уровни, или "якоря", по терминологии Сакавы.
Первый якорь осуществляет проверку ответа языковой модели на соответствие проверяемым источникам. Второй якорь анализирует, не нарушает ли вывод какие-либо регуляторные требования, например, американский закон о конфиденциальности в здравоохранении HIPAA, европейский всеобъемлющий регламент по защите данных и приватности GDPR или не раскрывает ли он личную идентифицируемую информацию (PII). Последний якорь формирует аудиторский след, демонстрирующий, как принимались все предыдущие решения, и дает возможность регуляторам или аудиторам "проанализировать цепочку рассуждений модели: откуда взялось решение, источник этого решения, уровень уверенности во всех этих решениях", — объяснил Сакава.
Сакава подчеркнул, что Elloe AI не основана на языковой модели, поскольку, по его мнению, использование одной языковой модели для проверки другой — это всего лишь "пластырь на рану". Тем не менее, система применяет методы искусственного интеллекта, включая машинное обучение. Кроме того, в процесс вовлечены люди: сотрудники Elloe AI, которые отслеживают новые регуляции в области защиты данных и пользователей, добавил Сакава.