RAG в AI-поддержке простыми словами
Retrieval-Augmented Generation — главное слово 2025-го в AI-чате на сайте. Что это и зачем.
RAG расшифровывается как Retrieval-Augmented Generation. Длинное название скрывает простую идею.
Когда пользователь пишет в чат, мы НЕ отдаём вопрос напрямую LLM. Сначала ищем в вашей базе знаний релевантные куски (векторный поиск). Потом передаём в LLM эти куски ВМЕСТЕ с вопросом — модель отвечает на основе ваших данных.
Зачем это нужно:
- LLM ничего не знает про ваши процессы и продукты — без RAG она будет гадать.
- RAG позволяет давать ссылки на источники в ответе — пользователь может проверить.
- Обновлять знания — просто добавить документы, не нужно дообучать модель.
На практике: мы делаем RAG-чат на сайте за 2-3 недели. База знаний — ваши FAQ, инструкции, документация продукта.