RAGCache: Efficient Knowledge Caching for Retrieval-Augmented Generationhttps://arxiv.org/pdf/2404.12457 요약: 본 논문에서는 Retrieval-Augmented Generation (RAG) 시스템의 효율성을 높이기 위해 새로운 멀티 레벨 동적 캐싱 시스템인 RAGCache를 제안한다. RAG는 대규모 언어 모델(LLM)과 외부 지식 데이터 베이스의 장점을 결합하여 자연어 처리 작업에서 성능을 크레 향상시켰다.하지만 RAG는 긴 시퀀스 생성을 유도하고, 이는 높은 계산 및 메모리 비용으로 이어진다. RAG란: RAG(Retrieval-Augmented Generation, 검색 증강 생성)는 외부 지식 데이터 베이스와..