AI 에이전트2020

RAG — 검색 증강 생성

외부 검색을 결합해 LLM의 지식 한계와 환각을 줄이는 패턴이 정립

RAG(Retrieval-Augmented Generation)는 모델 내부 파라미터에만 의존하지 않고, 검색기로 관련 문서를 찾은 뒤 그 문맥을 바탕으로 답변을 생성하는 방식입니다. 원래는 지식 집약적 NLP 과제를 위한 연구였지만, 2023~2024년을 거치며 챗봇, 사내 지식 검색, 에이전트 시스템의 기본 아키텍처로 자리 잡았습니다.

핵심 개념

Retriever

질문과 관련된 문서·청크를 외부 저장소에서 검색하는 구성요소

Grounding

모델 답변을 외부 근거 문서에 기반하게 만들어 사실성을 높이는 것

Vector DB

임베딩 기반 유사도 검색을 위해 문서를 저장·조회하는 데이터베이스

주요 인물

P
Patrick Lewis
RAG 논문 1저자 (Facebook AI Research)
D
Douwe Kiela
RAG 공동 저자, 지식 집약형 NLP 연구 주도

영향 & 의의

LLM을 '닫힌 모델'에서 '외부 지식과 연결된 시스템'으로 바꾼 전환점. 이후 에이전트, 기업용 AI 검색, 고객지원 봇, 개발 문서 QA의 사실상 기본 구조가 되었습니다.

용어집

RAGRetrieval-Augmented Generation

검색 증강 생성. 검색된 문서를 바탕으로 답변을 생성하는 구조

ChunkingChunking

긴 문서를 검색 가능한 작은 단위로 쪼개는 전처리 과정

EmbeddingEmbedding

텍스트 의미를 벡터로 변환한 표현. 유사도 검색의 핵심

GroundingGrounding

외부 문서나 데이터에 모델 답변을 근거 있게 연결하는 것

Top-K RetrievalTop-K Retrieval

유사도가 높은 상위 K개 문서를 검색해 컨텍스트로 주입하는 방식

관련 항목