상세문의 아이콘 상세문의
간편문의 아이콘 × 간편문의

GEO 용어사전 · AI 동작 원리

토큰

Token

홍은표 · 넥스트티 대표 · SEO/GEO 컨설턴트

AI가 텍스트를 처리하는 최소 단위 조각. 단어보다 잘게 쪼갠 부분 문자열로, 모델은 글자가 아니라 토큰을 세고 읽는다.

토큰 — 단어보다 잘게 쪼갠 처리 단위
문장"생성형 엔진"
토큰화생성 / 형 / 엔 / 진
조각으로 분해
모델토큰 단위로
읽고·셈

컨텍스트 윈도우·비용·청킹이 모두 토큰으로 셈됩니다 — 한국어는 영어보다 토큰을 더 씁니다.

LLM은 문장을 글자나 단어 그대로 다루지 않고, 먼저 토큰이라는 조각으로 잘게 나눕니다(토큰화). 영어는 보통 단어보다 짧은 부분 단위로, 한국어는 더 잘게 쪼개지는 경향이 있어 같은 분량이라도 한국어가 토큰을 더 많이 소비합니다.

토큰을 알아야 하는 이유는 컨텍스트 윈도우·비용·요약 동작이 모두 토큰 단위로 셈해지기 때문입니다. AI가 한 번에 볼 수 있는 길이도, 문서를 잘라 넣는 청킹의 크기도 토큰으로 정해집니다. GEO 관점에서는 "핵심을 적은 토큰 안에 또렷이 담았는가"가 발췌·인용 가능성과 연결됩니다.

흔한 오해 바로잡기

  • 오해 토큰은 곧 단어다. 사실 토큰은 단어보다 잘게 쪼갠 조각입니다. 한국어는 영어보다 토큰을 더 많이 소비하는 경향이 있습니다.

왜 GEO에서 중요한가

AI가 읽고 비용을 매기고 잘라 넣는 모든 단위가 토큰입니다. 컨텍스트 윈도우·청킹을 이해하는 출발점입니다.

함께 읽기 · 넥스트티 인사이트

GEO 완전 가이드