상세문의 아이콘 상세문의
간편문의 아이콘 × 간편문의

GEO 용어사전 · AI 동작 원리

청킹 (문서 분할)

Chunking

홍은표 · 넥스트티 대표 · SEO/GEO 컨설턴트

긴 문서를 의미 단위의 작은 조각(청크)으로 잘라 두는 것. RAG는 글 전체가 아니라 이 청크 단위로 검색하고 인용한다.

청킹 — 글은 조각으로 잘려 '관련 청크'만 검색된다
문서긴 글 1편
청킹의미 단위로 분할
검색질문에 맞는
청크만 추출
인용그 청크가 근거로

AI는 글 전체가 아니라 잘린 청크를 봅니다 — 조각만 떼어도 말이 되는 자기완결 단락이 인용에 유리합니다.

컨텍스트 윈도우에 글 전체를 넣을 수 없기 때문에, RAG 시스템은 문서를 미리 청크로 잘라 인덱싱합니다. 질문이 들어오면 글 전체가 아니라 관련 있는 청크만 골라 와 답의 근거로 씁니다.

그래서 GEO에서는 "내 글이 청크로 잘렸을 때도 말이 되는가"가 중요해집니다. 한 단락이 앞뒤 문맥에 기대 있으면, 그 조각만 떼어 왔을 때 의미가 무너져 인용 후보에서 밀립니다. 소제목·정의형 문장·자기완결 구조가 좋은 청킹을 돕는 이유입니다 — 다만 청킹 방식은 시스템마다 달라 "이렇게 쓰면 반드시 잘 잘린다"고 단정할 수는 없습니다.

Python (의사코드) 글 전체가 아니라 잘린 청크가 검색·인용된다
# 긴 문서를 청크로 잘라 인덱싱
chunks = split(document, size=512, overlap=50)
for c in chunks:
    index.add(embed(c))   # 검색은 글 전체가 아니라 '청크' 단위

왜 GEO에서 중요한가

AI는 글 전체가 아니라 청크 단위로 검색·인용합니다. 조각으로 잘려도 완결되는 글이 살아남습니다.

함께 읽기 · 넥스트티 인사이트

인용되는 콘텐츠 품질 (되먹임 루프)