-
Clova Studio 를 활용한 RAG 구성Clova Studio 2025. 4. 2. 15:27
Clova Studio 홈
https://guide.ncloud-docs.com/docs/clovastudio-screen
CLOVA Studio 홈 화면
guide.ncloud-docs.com
https://clovastudio.ncloud.com/
[온라인 웨비나] CLOVA Studio를 활용한 RAG 구성
https://www.youtube.com/watch?v=Snft1gFbDmU
01. 플레이 그라운드
demo
유형별로 test / table / image 를 개별적으로 추출
중복 좌표 확인 및 정리?
임베딩 모델
bge-m3 를 추천
토큰수가 크고, 가장 좋음
vector db :
postgre, opensearch?
milvus, Qdrant : 대규모 데이터에 최적화, 실시간 데이터와 검색 성능 우수
SingStore,
의도 분류 통한 디텍팅
문의인지? 요청인지?
detector 에서 검색 가능 여부 판단
라우터
요청과 콘텐츠를 분류하고 필터링
도메인 판별
다양한 도구와 연결
필터 - compliance
긴 문서 요약 - 비용 절감, 효율적, 토큰길이초과 방지
요약을 통해 응답 품질 최적화
의미 단위로 split 후 적절한 크기로 요약 후 merge
parsing 영역설정, 제목 제거? 화자분리, 문단 분리
토큰화
의미없는 불용어 제거
단어 빈도 계산 -> 핵심 키워드 선정 -> 프롬프트에 추가