상세문의 아이콘 상세문의
간편문의 아이콘 × 간편문의

GEO 용어사전 · AI 동작 원리

임베딩 · 벡터 유사도

Embedding · Vector Similarity

홍은표 · 넥스트티 대표 · SEO/GEO 컨설턴트

문장을 숫자 좌표(벡터)로 바꿔 의미가 가까운 글끼리 가깝게 놓는 기술. AI가 "관련 있는 문서"를 찾는 잣대.

의미 공간 — 뜻이 가까운 말은 좌표도 가깝다
강아지 반려견 자동차 작은 각 = 높은 유사도

두 벡터가 이루는 각(코사인 유사도)이 작을수록 의미가 가깝다고 봅니다 — 단, 가까움은 상관일 뿐 "그래서 인용됐다"는 인과가 아닙니다.

컴퓨터는 글의 의미를 직접 이해하지 못하므로, 문장을 수백~수천 차원의 좌표(벡터)로 변환합니다. 이렇게 하면 "강아지"와 "반려견"처럼 뜻이 비슷한 말은 좌표 공간에서 가깝게 모입니다. 두 벡터가 이루는 각도로 가까움을 재는 것이 코사인 유사도입니다.

RAG가 문서를 검색할 때 바로 이 유사도를 씁니다. 그래서 "유사도가 높아서 인용됐다"는 설명이 흔하지만 — 주의가 필요합니다. 유사도는 상관(가까움)일 뿐 인과(그래서 인용됨)가 아닙니다. 가설을 좁히는 보조 도구로는 훌륭하지만, 인용 이유를 확정하는 근거로 쓰면 과장이 됩니다.

왜 GEO에서 중요한가

검색·추천·인용 후보 선정의 밑바탕이 임베딩입니다. 단, 유사도를 "인용의 이유"로 단정하면 상관을 인과로 착각하는 오류가 됩니다.

함께 읽기 · 넥스트티 인사이트

관측과 추정의 경계