
RAG의 R, Retrieval(검색)그 고도화 방법에 대해서
·
LLM/Application
필자는 지금 회사에서 하고 있는 프로젝트 수행 중에서 검색 기능을 구현하고 있다. 지금은 기본적인 RAG에서의 검색 기능만 갖추고 있기에 현재까지 구현된 검색 기법은 어떤 기술에 비롯되었는지, 또 이를 어떻게 고도화할 수 있을지에 대해서 알아보았다. 아래는 아래 글의 요약이다. Hybrid Search (BM25 + bi-encoder): 키워드와 의미를 모두 반영하여 다양한 질의 유형에 강건한 검색 성능 확보 가능. Cross-Encoder Reranking: 빠른 초기 검색(Hybrid Search) 후 후보 문서의 정밀 재정렬. 정답 문서가 context 상위에 배치되도록 하여 응답 품질 향상. Query Expansion: 사용자의 표현력에 의존하지 않고 다양한 질의 버전을 생성해 검색 re..