RAG

RAG (Retrieval-Augmented Generation)는 대규모 언어 모델(LLM)의 한계를 보완하기 위해 개발된 기술로, 정보 검색과 텍스트 생성을 결합하여 보다 정확하고 맥락에 맞는 답변을 제공하는 자연어 처리(NLP) 프레임워크입니다. 

이 기술은 LLM이 외부 데이터 소스를 활용할 수 있도록 하여, 기존의 정적 훈련 데이터만으로 작업할 때 발생하는 문제를 해결합니다.

RAG 작동 원리
RAG는 크게 네 가지 단계로 구성됩니다:

1. 데이터 준비 및 인덱싱:
외부 데이터(문서, 데이터베이스 등)를 벡터 임베딩(numerical representation)으로 변환하여 벡터 데이터베이스에 저장합니다. 이를 통해 검색 가능한 지식 라이브러리를 구축합니다.

2. 정보 검색(Retrieval)
사용자의 질의가 입력되면, 벡터 검색을 통해 가장 관련성이 높은 문서를 선택합니다. 이 과정은 사용자의 질문과 데이터베이스 내 문서 간의 유사도를 계산하여 이루어집니다.

3. 질의 보강(Augmentation):
검색된 정보를 사용자의 원래 질문에 추가하여 LLM에 전달합니다. 이를 통해 모델이 보다 정확하고 맥락에 맞는 답변을 생성할 수 있습니다.

4. 응답 생성(Generation):
LLM은 사용자 질의와 검색된 정보를 바탕으로 최종 답변을 생성하며, 필요 시 출처를 명시하여 신뢰성을 높입니다.

 RAG의 주요 특징

 

1. 최신 정보 제공:
LLM은 정적 훈련 데이터를 기반으로 작동하므로 최신 정보가 부족할 수 있습니다. RAG는 실시간으로 업데이트되는 외부 데이터를 활용해 이러한 한계를 극복합니다.

2. 정확성과 신뢰성 향상
RAG는 LLM이 "환각(hallucination)" 현상(잘못된 정보를 자신 있게 생성하는 문제)을 줄이고, 정확한 출처를 기반으로 답변을 생성하도록 돕습니다.

3. 비용 효율성:
기존 모델을 재훈련하지 않고도 새로운 데이터 소스를 추가할 수 있어 비용과 시간이 절약됩니다.

4. 출처 명시:
RAG는 생성된 답변에 사용된 데이터 출처를 명확히 표시할 수 있어 사용자 신뢰를 증대시킵니다.

 활용 사례
- 기업 내부 데이터 활용: 

고객 서비스 챗봇이 회사 내부 문서나 정책 자료를 기반으로 정확한 답변 제공.


- 의료 및 금융 분야: 최신 의학 연구나 시장 데이터를 활용해 전문가 수준의 조언 제공.


- 교육 및 연구: 특정 학문 분야의 최신 논문이나 자료를 기반으로 질의응답 수행.

---

 RAG의 장점과 한계
| 장점                              | 한계                              |
|-----------------------------------|-----------------------------------|
| 최신 정보와 도메인 지식 활용 가능 | 외부 데이터 품질에 따라 성능 좌우 |
| 환각 문제 감소                   | 벡터 데이터베이스 관리 필요       |
| 비용 효율적 구현                 | 실시간 업데이트 시스템 구축 필요 |

---

RAG는 LLM의 강력한 언어 생성 능력을 도메인별 또는 최신 정보와 결합함으로써 다양한 산업에서 활용 가능성을 확장하고 있습니다. 이는 특히 정밀성과 신뢰성이 중요한 분야에서 매우 유용한 기술로 자리 잡고 있습니다.

Citations:
[1] https://en.wikipedia.org/wiki/Retrieval-augmented_generation
[2] https://www.oracle.com/in/artificial-intelligence/generative-ai/retrieval-augmented-generation-rag/
[3] https://aws.amazon.com/what-is/retrieval-augmented-generation/?trk=faq_card
[4] https://research.ibm.com/blog/retrieval-augmented-generation-RAG
[5] https://www.superannotate.com/blog/rag-explained
[6] https://cloud.google.com/use-cases/retrieval-augmented-generation?e=48754805&hl=en
[7] https://blogs.nvidia.com/blog/what-is-retrieval-augmented-generation/
[8] https://www.databricks.com/glossary/retrieval-augmented-generation-rag
[9] https://www.igloo.co.kr/security-information/ragretrieval-augmented-generation-llm%EC%9D%98-%ED%95%9C%EA%B3%84%EC%99%80-%EB%B3%B4%EC%99%84-%EB%B0%A9%EB%B2%95/
[10] https://jeonsworld.github.io/NLP/rag/
[11] https://aws.amazon.com/ko/what-is/retrieval-augmented-generation/
[12] https://modulabs.co.kr/blog/retrieval-augmented-generation
[13] https://www.oracle.com/kr/artificial-intelligence/generative-ai/retrieval-augmented-generation-rag/
[14] https://dwin.tistory.com/172
[15] https://www.cohesity.com/glossary/retrieval-augmented-generation-rag/
[16] https://stackoverflow.blog/2023/10/18/retrieval-augmented-generation-keeping-llms-relevant-and-current/

---
Perplexity로부터의 답변: pplx.ai/share
Citations:
[1] https://www.aitimes.com/news/articleView.html?idxno=167755
[2] https://ko.wikipedia.org/wiki/%EC%99%80%EC%9D%B4%EC%A6%88%EB%84%9B
[3] https://www.news2day.co.kr/article/20250115500134
[4] https://www.pinpointnews.co.kr/news/articleView.html?idxno=319645
[5] https://www.wisenut.com/sub/company/vision.php
[6] https://www.etnews.com/20250108000273
[7] https://k-global.kr/ict/ictcorpView.do?corp_id=CP_201610120100
[8] https://www.wisenut.com
[9] https://www.wisenut.com/sub/company/greeting.php
[10] https://www.wisenut.com/sub/company/history.php
[11] https://zdnet.co.kr/view/?no=20240711163343
[12] https://www.saramin.co.kr/zf_user/company-info/view/csn/anV4RmMxWjdGODRUVDI2aDRYN2Ixdz09/company_nm/(%EC%A3%BC)%EC%99%80%EC%9D%B4%EC%A6%88%EB%84%9B
[13] https://www.eugenefn.com/common/files/amail/20250106_B_jongsun.park_2280.pdf
[14] https://www.wisenut.com/sub/promotion/press_view.php?idx=138
[15] http://amc.wisenut.co.kr/upload/adplus_agency.pdf
[16] https://www.hankyung.com/article/2025010834795
[17] https://www.ibtomato.com/view.aspx?no=13659
[18] https://www.jobkorea.co.kr/NET/jkWebModule/jkConfirm.aspx?r=1&a=%2FNET&ret=%2Fcompany%2F42825611
[19] https://www.edaily.co.kr/News/Read?newsId=03985206639117208&mediaCodeNo=257
[20] https://www.wisenut.com/sub/promotion/press_view.php?idx=162

---
Perplexity로부터의 답변: pplx.ai/share

'용어사전' 카테고리의 다른 글

반도체 포토공정  (0) 2025.02.10
품절주  (0) 2025.02.09
액면분할  (0) 2025.02.09
CAN SLIM  (0) 2025.02.09