Безопасность LLM в корпоративных проектах: чек-лист 1IT
LLM в продакшене — новый класс уязвимостей. Что проверять перед запуском и как защититься от prompt injection и утечек.
OWASP опубликовал Top 10 для LLM Applications: prompt injection, insecure output handling, training data poisoning, model DoS и др. В корпоративном проекте каждая угроза превращается в конкретный риск. 1IT использует чек-лист на 50+ пунктов для аудита LLM-систем.
Главные риски
- Prompt injection — пользователь подменяет инструкции системы.
- Утечка системного промпта — раскрытие IP, бизнес-логики.
- Утечка ПДн через few-shot примеры или RAG-контекст.
- Hallucinations — выдуманные ссылки, несуществующие документы.
- Excessive agency — агент выполняет действия без подтверждения.
Защита на уровне промпта
Системный промпт изолируется от пользовательского ввода через структурированные сообщения. Используем фильтры на вход (LLM Guard, NeMo Guardrails) и выход (DLP-проверка). При обнаружении инъекции — блокировка с логированием.
Защита на уровне архитектуры
- Изоляция LLM-сервиса в отдельном сегменте сети.
- Минимальные привилегии токенов API.
- Rate limiting и квоты по пользователю.
- Аудит-лог всех запросов с маскированием ПДн.
- Обязательное human-in-the-loop для критичных действий.
Тестирование
Перед продакшеном — red-team тестирование: набор из 200–500 атакующих промптов, проверка на jailbreak, попытки извлечь системный промпт, инъекции через RAG-документы. 1IT проводит red-team в формате pentest для AI-приложений.
Частые вопросы
Можно ли полностью защититься от prompt injection?+
Нет, как и от XSS. Но многослойная защита (фильтры, изоляция, минимальные привилегии) сводит риск к приемлемому.
Кто должен отвечать за безопасность LLM?+
Совместно ИБ и команда AI. ИБ задаёт требования, команда AI реализует. 1IT часто выступает арбитром и выполняет независимый аудит.
Что с регуляторикой?+
ФСТЭК и Роскомнадзор готовят методические рекомендации по AI-системам. Уже сейчас при обработке ПДн через LLM применяются требования 152-ФЗ и приказа № 21.
Нужна помощь по этой теме?
Обсудим задачу и предложим план за 24 часа. Работаем с компаниями из России и СНГ с 1999 года.
Похожие материалы
GigaChat в корпоративных процессах: 5 рабочих сценариев 2026
GigaChat вышел из стадии экспериментов в продакшен. Какие пять сценариев дают окупаемость в первые 3–6 месяцев.
ЧитатьRAG на YandexGPT: корпоративный поиск со ссылками на источники
RAG превращает LLM из «галлюцинатора» в надёжного помощника. Как 1IT строит RAG на YandexGPT с замером качества.
ЧитатьАудит 152-ФЗ за 4 недели: чек-лист и типовые нарушения
Штрафы по 152-ФЗ выросли в 10 раз в 2024 году. Как пройти аудит без претензий и привести ИСПДн в соответствие за месяц.
Читать