RAG на YandexGPT: корпоративный поиск со ссылками на источники
RAG превращает LLM из «галлюцинатора» в надёжного помощника. Как 1IT строит RAG на YandexGPT с замером качества.
Retrieval-Augmented Generation — обязательный паттерн для корпоративных AI-ассистентов. Модель отвечает только на основе ваших документов, со ссылками. YandexGPT 4 + yandex-embeddings + векторная база — рабочий стек, проверенный 1IT в десятке проектов.
Архитектура
- Источники: wiki, СЭД, портал, PDF — ETL в единое хранилище.
- Чанкование: 400–800 токенов с overlap 100, по семантическим границам.
- Embeddings: yandex-embeddings или e5-multilingual.
- Векторная база: Qdrant, Weaviate или pgvector.
- LLM: YandexGPT 4 Pro для синтеза ответа.
Качество поиска
Чистый векторный поиск даёт 60–70% recall. Гибрид векторного + BM25 + reranker (cross-encoder) поднимает до 85–92%. Reranker критически важен для длинных документов и технических текстов.
Цитирование и доверие
В каждом ответе — список источников со ссылкой на исходный документ и фрагмент текста. Без цитирования RAG быстро теряет доверие пользователей.
Метрики и приёмка
- Подготовить «золотой набор» 100–300 пар вопрос-ответ.
- Замер метрик: hit rate@k, MRR, faithfulness, answer relevance.
- Регрессионный прогон при каждом обновлении промпта или модели.
- A/B сравнение с baseline (классический поиск).
Частые вопросы
Сколько документов можно индексировать?+
Технически — миллионы. На практике 1IT работает с базами 10–500 тыс. документов, после этого начинаются нюансы рерэнкинга и кэширования.
Какой бюджет на пилот?+
Пилот RAG с базой 5–10 тыс. документов — от 800 тыс. ₽ за 5–7 недель. Включает архитектуру, индексацию, веб-интерфейс и метрики качества.
Можно ли заменить YandexGPT на другую модель?+
Да, архитектура модельно-агностична. Используем GigaChat, локальные Qwen/Saiga при on-prem требованиях.
Нужна помощь по этой теме?
Обсудим задачу и предложим план за 24 часа. Работаем с компаниями из России и СНГ с 1999 года.
Похожие материалы
GigaChat в корпоративных процессах: 5 рабочих сценариев 2026
GigaChat вышел из стадии экспериментов в продакшен. Какие пять сценариев дают окупаемость в первые 3–6 месяцев.
ЧитатьБезопасность LLM в корпоративных проектах: чек-лист 1IT
LLM в продакшене — новый класс уязвимостей. Что проверять перед запуском и как защититься от prompt injection и утечек.
ЧитатьAI-агенты для 1С: автоматизация бухгалтерии и кадров
AI-агенты экономят бухгалтерам 10–15 часов в неделю. Как встроить GigaChat и YandexGPT в 1С без переписывания конфигурации.
Читать