Бум искусственного интеллекта охватил все отрасли, и организации государственного сектора испытывают давление, чтобы ускорить внедрение технологий. При этом госучреждения сталкиваются с уникальными ограничениями по безопасности, управлению и эксплуатации, которые отличают их от коммерческих структур. Специализированные малые языковые модели (SLM) предлагают надежный способ запустить ИИ в таких условиях.

Исследование Capgemini выявило, что 79 процентов руководителей госсектора по всему миру опасаются за безопасность данных в ИИ. Это логично, учитывая повышенную чувствительность государственных данных и строгие юридические требования к их использованию. Хан Сяо, вице-президент по ИИ в Elastic, подчеркивает: «Государственные агентства строго ограничены в выборе данных для отправки в сеть. Такие рамки сильно влияют на подходы к данным и их обработке».
Необходимость полного контроля над конфиденциальной информацией — лишь один из факторов, усложняющих развертывание ИИ, особенно по сравнению с типичными условиями частного сектора.
Особые эксплуатационные вызовы
При расширении ИИ в коммерции обычно предполагают постоянное подключение к облаку, централизованную инфраструктуру, частичную непрозрачность моделей и минимум ограничений на перемещение данных. Для многих госструктур такие допущения либо рискованны, либо невозможны.
Государственные агентства обязаны держать данные под контролем, проверять и верифицировать информацию, минимизировать сбои в работе. Часто системы работают в условиях ограниченного, ненадежного или отсутствующего интернета. Эти сложности не дают многим перспективным пилотным проектам ИИ в госсекторе выйти за рамки тестов. «Многие недооценивают эксплуатационные трудности ИИ», — говорит Сяо. «Госсектору нужен ИИ, который стабильно работает с разными данными и масштабируется без срывов. Непрерывность операций часто недооценивают». Опрос Elastic среди лидеров госсектора показал, что 65 процентов испытывают проблемы с непрерывным использованием данных в реальном времени и в больших объемах.
Ограничения инфраструктуры усугубляют ситуацию. Госорганизации часто не могут получить графические процессоры (GPU), необходимые для обучения и работы сложных моделей ИИ. Как отмечает Сяо: «Государство редко закупает GPU, в отличие от частного сектора — они не привыкли управлять такой инфраструктурой. Доступ к GPU для запуска моделей становится узким местом для многих госструктур».
Меньшая и практичная модель
Множество обязательных требований в госсекторе делают крупные языковые модели (LLM) неприемлемыми. SLM же размещаются локально, обеспечивая высокий уровень безопасности и контроля. Это специализированные модели ИИ с миллиардами параметров вместо сотен миллиардов, что делает их гораздо менее требовательными к вычислениям по сравнению с самыми большими LLM.
Госсектору не нужны все более крупные модели в удаленных централизованных хранилищах. Эмпирическое исследование подтвердило, что SLM работают на уровне LLM или лучше. Такие модели позволяют эффективно использовать чувствительную информацию без сложностей в поддержке больших систем. Сяо объясняет: «Легко использовать ChatGPT для проверки текста. Гораздо сложнее запустить собственную крупную языковую модель так же гладко без доступа к сети».
SLM создаются под нужды конкретного ведомства или агентства. Данные хранятся отдельно от модели в защищенном виде и извлекаются только по запросу. Точные промты гарантируют retrieval только релевантной информации для точных ответов. С помощью методов вроде умного retrieval, векторного поиска и grounding на проверенных источниках можно строить ИИ-системы, подходящие для госнужд.
Следующий этап внедрения ИИ в госсекторе — приносить инструмент к данным, а не отправлять данные в облако. Gartner прогнозирует, что к 2027 году малые специализированные модели ИИ будут использоваться втрое чаще LLM.
Превосходные возможности поиска
«Когда в госсекторе слышат про ИИ, многие думают о ChatGPT. Но можно ставить более амбициозные цели», — говорит Сяо. «ИИ способен радикально изменить поиск и управление огромными объемами данных в правительстве».
За пределами чат-ботов открывается ключевая возможность ИИ: качественно улучшенный поиск. Как и в других организациях, в госсекторе полно неструктурированных данных — технические отчеты, документы по закупкам, протоколы, счета. Современный ИИ обрабатывает смешанные источники: читаемые PDF, сканы, изображения, таблицы, аудиозаписи, на разных языках. Системы на базе SLM индексируют это для персонализированных ответов, составления текстов на любом языке с соблюдением юридических норм. «У госсектора много данных, но они не всегда знают, как их задействовать и какие варианты возможны», — добавляет Сяо.
Еще мощнее — помощь в интерпретации данных. «Современный ИИ дает свежий взгляд на использование данных», — считает Сяо. Хорошо обученная SLM разбирает правовые нормы, извлекает выводы из общественных консультаций, поддерживает решения на основе данных и улучшает доступ граждан к услугам и информации. Это радикально меняет операции госсектора.
Перспективы малых языковых моделей
Фокус на SLM смещает акцент с всеобъемлющности модели на ее эффективность. LLM требуют огромных ресурсов и специализированного оборудования, недоступного многим госструктурам. SLM, хоть и нуждаются в инвестициях, менее затратны, дешевле в эксплуатации и экологичнее.
Госагентства часто подчиняются строгим аудитам, и алгоритмы SLM можно документировать и сертифицировать как прозрачные. В странах вроде европейских, с правилами вроде GDPR, SLM проектируют с учетом таких норм.
Обучение на целевых данных дает точные результаты с меньшим риском ошибок, предвзятости и галлюцинаций. По словам Сяо: «Крупные модели генерируют текст на основе обучающих данных с cutoff-дата. На вопросы после этой даты они галлюцинируют. Мы решаем это, заставляя модель опираться на проверенные источники».
Риски снижаются за счет хранения данных на локальных серверах или даже устройствах. Это не изоляция, а стратегическая независимость для доверия, устойчивости и актуальности.
Приоритизируя модели под конкретные задачи с локальной обработкой данных и постоянным мониторингом, госорганизации создают устойчивые ИИ-возможности для реальных решений. «Не начинайте с чат-бота — стартуйте с поиска», — советует Сяо. «Большая часть ИИ-интеллекта — это поиск нужной информации».