사내에 흩어진 기술문서·특허·실험노트를 RAG로 검색하는 어시스턴트를 만든다. 자연어 질문에 출처를 함께 제시해 신뢰성을 확보하고, 연구원의 선행기술 조사 시간을 단축한다. 목표: 조사 리드타임 3일 → 반나절.
진행자
검수자
모니터링
마일스톤 아래 태스크를 추가하고 상태를 체크하세요.
기획안·피드백·발표 자료와 스크린샷을 한곳에 모아두세요.
아직 업로드된 자료가 없습니다.
특허 PDF 표·수식 파싱이 깨집니다
PDF에서 표와 수식이 깨져서 검색 품질이 떨어집니다.
임수아 · 5. 29. PM 01:38
청크 사이즈는 어느 정도가 적당한가요?
기술문서 기준으로 청킹 사이즈/오버랩 가이드가 궁금합니다.
오현우 · 5. 19. PM 01:38
기술문서는 400~600 토큰 + 15% 오버랩에서 시작해 평가셋으로 튜닝하세요. 표/그림 캡션은 별도 청크로 분리하면 검색 품질이 확 올라갑니다.
강도현 · 5. 20. PM 07:38
검색 품질 리뷰
2026-05-24 · 강도현
인덱싱은 잘 됐습니다. 평가셋 30문항을 먼저 만들어 정량 비교를 시작하세요. 출처 표시는 신뢰성에 필수이니 우선순위로 두세요.
임수아 태스크 '청킹·임베딩 인덱스'를 진행중으로 변경했습니다.
5. 31. AM 10:39
임수아 질문을 남겼습니다: '특허 PDF 표·수식 파싱이 깨집니다'
5. 29. PM 01:39