SLM запускают ИИ в госсекторе локально

Государственный сектор активно интересуется ИИ, но ограничения по безопасности и инфраструктуре тормозят внедрение: 79% руководителей беспокоятся о данных. Малые языковые модели SLM решают проблемы, работая локально, обеспечивая контроль и эффективность, как показывают исследования и прогноз Gartner. Они улучшают поиск, анализ данных и операции без облака.

Бум искусственного интеллекта охватил все отрасли, и организации государственного сектора испытывают давление, чтобы ускорить внедрение технологий. При этом госучреждения сталкиваются с уникальными ограничениями по безопасности, управлению и эксплуатации, которые отличают их от коммерческих структур. Специализированные малые языковые модели (SLM) предлагают надежный способ запустить ИИ в таких условиях.

Иллюстрация вызовов внедрения ИИ в государственном секторе

Исследование Capgemini выявило, что 79 процентов руководителей госсектора по всему миру опасаются за безопасность данных в ИИ. Это логично, учитывая повышенную чувствительность государственных данных и строгие юридические требования к их использованию. Хан Сяо, вице-президент по ИИ в Elastic, подчеркивает: «Государственные агентства строго ограничены в выборе данных для отправки в сеть. Такие рамки сильно влияют на подходы к данным и их обработке».

Необходимость полного контроля над конфиденциальной информацией — лишь один из факторов, усложняющих развертывание ИИ, особенно по сравнению с типичными условиями частного сектора.

Особые эксплуатационные вызовы

При расширении ИИ в коммерции обычно предполагают постоянное подключение к облаку, централизованную инфраструктуру, частичную непрозрачность моделей и минимум ограничений на перемещение данных. Для многих госструктур такие допущения либо рискованны, либо невозможны.

Государственные агентства обязаны держать данные под контролем, проверять и верифицировать информацию, минимизировать сбои в работе. Часто системы работают в условиях ограниченного, ненадежного или отсутствующего интернета. Эти сложности не дают многим перспективным пилотным проектам ИИ в госсекторе выйти за рамки тестов. «Многие недооценивают эксплуатационные трудности ИИ», — говорит Сяо. «Госсектору нужен ИИ, который стабильно работает с разными данными и масштабируется без срывов. Непрерывность операций часто недооценивают». Опрос Elastic среди лидеров госсектора показал, что 65 процентов испытывают проблемы с непрерывным использованием данных в реальном времени и в больших объемах.

Ограничения инфраструктуры усугубляют ситуацию. Госорганизации часто не могут получить графические процессоры (GPU), необходимые для обучения и работы сложных моделей ИИ. Как отмечает Сяо: «Государство редко закупает GPU, в отличие от частного сектора — они не привыкли управлять такой инфраструктурой. Доступ к GPU для запуска моделей становится узким местом для многих госструктур».

Меньшая и практичная модель

Множество обязательных требований в госсекторе делают крупные языковые модели (LLM) неприемлемыми. SLM же размещаются локально, обеспечивая высокий уровень безопасности и контроля. Это специализированные модели ИИ с миллиардами параметров вместо сотен миллиардов, что делает их гораздо менее требовательными к вычислениям по сравнению с самыми большими LLM.

Госсектору не нужны все более крупные модели в удаленных централизованных хранилищах. Эмпирическое исследование подтвердило, что SLM работают на уровне LLM или лучше. Такие модели позволяют эффективно использовать чувствительную информацию без сложностей в поддержке больших систем. Сяо объясняет: «Легко использовать ChatGPT для проверки текста. Гораздо сложнее запустить собственную крупную языковую модель так же гладко без доступа к сети».

SLM создаются под нужды конкретного ведомства или агентства. Данные хранятся отдельно от модели в защищенном виде и извлекаются только по запросу. Точные промты гарантируют retrieval только релевантной информации для точных ответов. С помощью методов вроде умного retrieval, векторного поиска и grounding на проверенных источниках можно строить ИИ-системы, подходящие для госнужд.

Следующий этап внедрения ИИ в госсекторе — приносить инструмент к данным, а не отправлять данные в облако. Gartner прогнозирует, что к 2027 году малые специализированные модели ИИ будут использоваться втрое чаще LLM.

Превосходные возможности поиска

«Когда в госсекторе слышат про ИИ, многие думают о ChatGPT. Но можно ставить более амбициозные цели», — говорит Сяо. «ИИ способен радикально изменить поиск и управление огромными объемами данных в правительстве».

За пределами чат-ботов открывается ключевая возможность ИИ: качественно улучшенный поиск. Как и в других организациях, в госсекторе полно неструктурированных данных — технические отчеты, документы по закупкам, протоколы, счета. Современный ИИ обрабатывает смешанные источники: читаемые PDF, сканы, изображения, таблицы, аудиозаписи, на разных языках. Системы на базе SLM индексируют это для персонализированных ответов, составления текстов на любом языке с соблюдением юридических норм. «У госсектора много данных, но они не всегда знают, как их задействовать и какие варианты возможны», — добавляет Сяо.

Еще мощнее — помощь в интерпретации данных. «Современный ИИ дает свежий взгляд на использование данных», — считает Сяо. Хорошо обученная SLM разбирает правовые нормы, извлекает выводы из общественных консультаций, поддерживает решения на основе данных и улучшает доступ граждан к услугам и информации. Это радикально меняет операции госсектора.

Перспективы малых языковых моделей

Фокус на SLM смещает акцент с всеобъемлющности модели на ее эффективность. LLM требуют огромных ресурсов и специализированного оборудования, недоступного многим госструктурам. SLM, хоть и нуждаются в инвестициях, менее затратны, дешевле в эксплуатации и экологичнее.

Госагентства часто подчиняются строгим аудитам, и алгоритмы SLM можно документировать и сертифицировать как прозрачные. В странах вроде европейских, с правилами вроде GDPR, SLM проектируют с учетом таких норм.

Обучение на целевых данных дает точные результаты с меньшим риском ошибок, предвзятости и галлюцинаций. По словам Сяо: «Крупные модели генерируют текст на основе обучающих данных с cutoff-дата. На вопросы после этой даты они галлюцинируют. Мы решаем это, заставляя модель опираться на проверенные источники».

Риски снижаются за счет хранения данных на локальных серверах или даже устройствах. Это не изоляция, а стратегическая независимость для доверия, устойчивости и актуальности.

Приоритизируя модели под конкретные задачи с локальной обработкой данных и постоянным мониторингом, госорганизации создают устойчивые ИИ-возможности для реальных решений. «Не начинайте с чат-бота — стартуйте с поиска», — советует Сяо. «Большая часть ИИ-интеллекта — это поиск нужной информации».

SLM упрощают внедрение ИИ в госсекторе

Особые эксплуатационные вызовы

Меньшая и практичная модель

Превосходные возможности поиска

Перспективы малых языковых моделей

Горячее

Тревожный сигнал: реальная цена ИИ от Google и Amazon

Alibaba запрещает сотрудникам использовать Claude Code

Последний экзамен человечества — отвлекающий манёвр?

Gemini Spark от Google теперь доступен на Mac

Anthropic представила Claude Science — ИИ-помощника для учёных

Сейчас в тренде