RAG(검색 증강 생성)란? AI가 사내 자료 활용하게 만들기

여기 가상의 기업 A가 있습니다. A기업은 고객이 질문을 하면, 정확한 대답을 내놓는 챗봇을 홈페이지에 도입하려고 합니다. 그런데 문제가 하나 있습니다. A기업 직원들이 평소 ChatGPT를 쓸 때, 잘못된 대답을 내놓는 경우가 종종 있었기 때문입니다. '우리 회사 데이터를 잘 알고, 정확한 대답을 내놓아야 하는데 챗봇이 엉뚱한 답변을 하면 어쩌지?' A기업은 이런 고민에 빠집니다.

‍

이런 상황에서 등장하는 개념이 바로 'RAG' 입니다. AI는 분명 유용한 기술이지만, 잘못된 대답을 할 때도 많은데요. 이때 우리가 원하는 대답을 정확하게 할 수 있도록 만들기 위해서 'RAG' 라는 기술을 활용할 수 있습니다. RAG가 무엇이고, 어디에 어떻게 쓰이는지 지금부터 자세히 알아보겠습니다.

‍

배운 만큼만 대답하는 AI의 한계

‍우리가 챗봇 같은 기능을 만들 때, LLM(Large Language Model)을 사용합니다. LLM이란 방대한 양의 데이터를 학습해서 인간처럼 문장을 이해하고 생성하는 AI 모델을 말합니다. 대표적으로 GPT가 있죠. 학습한 양이 많기 때문에 다양한 질문에 대한 대답을 내놓을 수 있고, 인간처럼 문장을 이해하고 생성할 수 있기 때문에 우리와 '대화'가 가능합니다.

‍

하지만 LLM에도 한계가 하나 있습니다. 바로 '학습한 정보'를 기반으로만 대답할 수 있다는 것입니다. 그래서 만약 학습하지 않은 우리 회사 내부 문서에 관련해 질문을 하면, 그럴듯한 거짓말을 지어내 대답하게 됩니다. 이처럼 사실이 아닌 정보를 진실인 것처럼 말하는 현상을 환각(Hallucination)이라고 합니다.

‍

LLM 환각현상 예시 — GPT 질문창 하단, 환각에 대한 경고 문구 (출처 : GPT)

‍

환각을 잡는 기술, RAG

이러한 문제를 해결하기 위해 등장한 것이 바로 RAG(Retrieval-Augmented Generation)입니다. RAG는 한국어로 풀면 '검색-증강 생성'이라는 뜻을 가지고 있습니다. 어려워보이지만, 단어의 뜻을 하나씩 풀어보면 그다지 어렵지 않습니다.

‍

‍우선 '검색'은 LLM이 답변하기 위해 정보를 가져오는 행위를 뜻합니다. 그리고 '증강'은 원래 있던 데이터에 무언가를 덧댄다는 의미입니다. 마지막으로 '생성'은 사용자의 질문에 답변하기 위해 응답을 생성하는 것을 의미합니다.

‍

즉, RAG란 원래 있던 데이터에 정보를 추가해서 더 나은 대답을 생성하는 기술이라고 이야기할 수 있습니다. 여기서 '정보를 추가한다'는 건 LLM이 정확한 답변을 하기 위해 꼭 필요한 사내 정보, 기업 내부에 저장된 최신 보고서 등이 되겠죠.

‍

RAG의 동작 과정을 정리해보면 이렇습니다.

‍

‍

1) 검색(Retrieval) 단계

사용자가 질문을 입력하면, 질문의 핵심 키워드를 먼저 파악합니다. 그 후 기업 내부 문서, 매뉴얼, 최신 보고서 등 추가된 데이터 베이스에서 질문과 관련된 정보를 찾아냅니다. 마치 도서관에서 원하는 책을 찾아내는 것과 유사합니다.

‍

2) 생성(Generation) 단계

찾아낸 정보를 참고 자료로 활용하여, 질문에 대한 가장 적확하고 맥락에 맞는 답변을 최종적으로 사용자에게 전달합니다. 이제 근거 없는 추측이 아닌, 확실한 자료를 바탕으로 답변하게 되는 것이죠.

‍

그래서 RAG를 도입하면 뭐가 좋을까?

RAG를 도입하면 기업은 다음과 같은 실질적인 효과를 얻을 수 있습니다.

‍

1) 정확도와 신뢰도 향상

LLM은 학습된 데이터에만 의존해 답변을 생성하기 때문에, 최신 정보나 회사 내부 규정에 대해서는 틀린 정보를 제공할 수 있습니다. RAG는 이런 '환각' 현상을 방지하고, 기업의 내부 문서나 최신 데이터를 기반으로 정확하고 신뢰성 있는 답변을 생성합니다. 또한 답변의 출처를 함께 제시해 사용자가 직접 정보를 검증할 수 있도록 돕습니다.

‍

2) 비용 및 시간 절감

LLM에 새로운 데이터를 학습시키려면 '파인튜닝(Fine-tuning)'이라는 복잡하고 비용이 많이 드는 과정을 거쳐야 합니다. 하지만 RAG는 LLM을 재학습시킬 필요 없이, 기업의 데이터베이스만 업데이트하면 AI가 최신 정보를 활용할 수 있습니다. 이는 개발 및 운영 비용을 크게 절감하고, AI 시스템을 더욱 민첩하게 유지할 수 있게 해줍니다.

‍

3) 보안 강화

기업의 민감한 내부 정보는 외부 LLM에 학습시키는 것이 위험할 수 있습니다. RAG는 내부 데이터베이스를 활용하고, 외부 LLM은 그저 참고 자료를 바탕으로 답변을 생성하는 역할만 수행하기 때문에, 데이터가 유출될 위험을 최소화할 수 있습니다.

‍

RAG, 어디에 어떻게 쓰이고 있을까?

그렇다면 RAG가 실제 비즈니스 환경에서 어떻게 활용될 수 있는지 구체적인 사례를 통해 더 자세히 알아보겠습니다. RAG는 LLM이 기업의 전문 지식을 활용하도록 돕기 때문에, 다양한 분야에서 혁신적인 변화를 만들어낼 수 있습니다.

‍

1) 고객 서비스 & 지원 챗봇

기존의 챗봇은 단순한 FAQ에만 답변할 수 있거나, 복잡한 질문에 대해 부정확한 답변을 하는 경우가 많았습니다. 고객 상담원이 수동으로 정보를 찾아야 하는 경우가 빈번했죠.

‍

하지만 RAG 기반의 챗봇은 최신 제품 매뉴얼, 서비스 약관, FAQ, 과거 고객 상담 이력 등의 데이터베이스를 활용하여 질문에 대한 정확한 답변을 실시간으로 제공합니다.

‍

예를 들어, '최근 출시된 A모델의 보증 기간은 어떻게 되나요?'라는 질문에, RAG는 최신 보증 정책 문서를 찾아 정확한 답변과 함께 해당 문서의 출처까지 제시합니다. 이를 통해 고객 만족도를 높이고, 상담원의 업무 부담을 줄일 수 있습니다.

‍

2) 사내 지식 검색 시스템

기업 규모가 커질수록 방대한 사내 문서(기술 매뉴얼, 인사 규정, 프로젝트 보고서 등) 속에서 필요한 정보를 찾는 데 많은 시간이 소요됩니다. 신입 직원은 정보 탐색에 어려움을 겪고, 숙련된 직원은 반복적인 질문에 답하느라 시간을 낭비합니다.

‍

하지만 RAG를 활용한 사내 지식 검색 시스템은 직원들이 자연어로 질문하면, 가장 관련성이 높은 문서를 찾아 답변을 생성합니다. 예를 들어, '휴가 신청 시 필요한 서류는 무엇인가요?'라고 물으면, RAG는 최신 인사 규정 문서를 찾아 답하고, 해당 규정의 페이지 링크를 함께 제공합니다.

‍

3) 전문 분야 의사결정 보조 시스템

법률 및 의료 분야는 최신 법규, 판례, 의학 논문 등 방대한 전문 지식이 끊임없이 업데이트됩니다. 전문가들도 모든 정보를 기억하고 추적하는 데 한계가 있습니다.

‍

하지만 RAG 기반 AI는 최신 법률 데이터베이스나 의료 저널을 참고하여 전문가의 업무를 보조할 수 있습니다. 예를 들어, 변호사가 '최근 특정 사건에 대한 유사 판례가 있나요?'라고 질문하면, RAG는 수많은 판례를 분석해 관련 정보를 요약하고 출처를 제공합니다. 의료 분야에서는 특정 증상에 대한 최신 임상 가이드라인을 제공하여 오진의 위험을 줄일 수 있습니다.

‍