본문 바로가기
IT

Advanced RAG(Retrieval-Augmented Generation)란?

by 황금반달곰 2024. 11. 3.

최근 AI에서 문서 검색 후 답변을 생성하는 RAG(Retrieval-Augmented Generation, 검색 증강 생성) 기술이 많이 쓰인다. Normal(Naive) RAG 보다 발전된 Advanced RAG는, AI 모델이 응답을 생성할 때, 단순히 데이터에서 키워드를 검색하는 방식을 넘어, 문맥과 의미를 심층적으로 이해하고 정보를 활용하는 고도화된 검색-생성 방식이다.

 

2024.10.20 - [IT] - Hallucination을 최소화하는 법, RAG(Retrieval Augmented Generation)

 

Hallucination을 최소화하는 법, RAG(Retrieval Augmented Generation)

Chat GPT로 인해 '23년부터 올해까지 다양한 AI챗봇 솔루션이 출시됐었다. 매우 많이 만나본 것은 아니지만, 어느 정도 이름이 알려진 기업부터 신생 스타트업까지 한 5~6개 기업을 만나봤었다. 기업

ourbooks.tistory.com


I. Advanced RAG의 핵심 특징과 기술적 개선점

1. 문맥 기반의 심층 검색

  • Advanced RAG는 전통적인 키워드 검색 방식이 아닌, 신경 검색(neural search) 기술을 사용하여 문맥을 고려한 의미적 유사성을 파악한다. 설령 동일한 키워드가 없더라도 문장의 의미가 유사하면 관련 문서를 정확히 검색해 낸다.
  • 이로 인해 AI가 단순히 텍스트를 복사하는 것이 아니라, 사용자의 질문 의도에 맞춘 정보를 찾아내는 데 유리하다.

2. 고급 정보 필터링과 선택

  • 검색된 결과 중에서도 불필요한 부분을 걸러내고, 질문에 적합한 정보만 선택해 응답을 생성한다. 이 과정에서 중복된 내용이나 덜 관련된 정보가 제거되어, 더 정확하고 간결한 답변을 제공한다.
  • 필터링이 잘 되어 있기 때문에 복잡한 질문이나 여러 개의 의도를 포함한 질문에 대해서도 일관된 응답을 할 수 있다.

3. 맞춤형 튜닝과 도메인 특화 학습

  • Advanced RAG는 특정 도메인에 맞게 맞춤형 튜닝이 되어 있다. 법률, 의학, 비즈니스 등 분야별로 최적화된 학습이 가능해, 해당 분야에서 정확한 응답을 제공할 수 있다.
  • 전문성이 요구되는 질문에 대해 깊이 있는 답변을 제공할 수 있어, 실제 현장에서의 활용도가 매우 높아진다.

4. 멀티모달 정보 활용

  • Advanced RAG는 텍스트뿐 아니라 이미지/비디오/음성 등 다양한 형태의 데이터를 동시에 검색하고 활용할 수 있다. 제품 설명을 위해 이미지 정보를 분석하거나, 특정 상황을 설명하기 위해 비디오의 자막 정보를 사용할 수 있다.
  • 멀티모달 처리가 가능해짐으로써 응답의 폭과 깊이가 확장되고, 복합적 질문에도 유연하게 대응할 수 있다.

II. 왜 Advanced RAG가 더 발전된 방식인가?

Advanced RAG는 기존 RAG 방식의 한계를 극복하고, 더 높은 정확도와 유연성을 제공하기 위해 개발되었다. 단순히 검색된 데이터를 그대로 사용하는 대신, 사용자의 질문 의도에 맞춘 응답을 제공할 수 있는 것이 큰 장점이다. 아래와 같은 이유로 Advanced RAG는 더 발전된 방식이라고 할 수 있다.

  • 의미 기반 검색으로 단순 키워드 일치를 넘어서, 문맥에 맞는 정보를 제공한다.
  • 불필요한 정보를 제거하고 핵심 정보만 선별하여, 더 간결하고 직관적인 응답을 생성한다.
  • 특정 분야에 맞춰 최적화할 수 있어, 전문성 있는 답변이 가능하다.
  • 텍스트 이외의 다양한 데이터를 통합하여 더 풍부한 응답을 생성한다.

DALL-E 생성 : Advanced AI