홍은표 · 넥스트티 대표 · SEO/GEO 컨설턴트
사이트 루트에 두는 파일(/robots.txt)로 어떤 봇이 어디를 크롤링해도 되는지 안내한다. 색인 차단 수단이 아니라 크롤 제어 수단이다.
CSS·JS를 막으면 렌더링·평가가 틀어집니다 — 색인 제거는 robots.txt가 아니라 noindex로.
robots.txt는 사이트 루트(/robots.txt)에 두는 평문 파일로, 크롤러에게 "이 경로는 긁어가도 되고, 저긴 자제해 달라"를 알려주는 안내문입니다. User-agent로 봇을 지정하고 Allow/Disallow로 경로 규칙을 적으며, 보통 Sitemap:으로 사이트맵 위치도 함께 명시합니다. 와일드카드(*)와 종료 기호($)로 패턴도 지정할 수 있고, 더 구체적인 규칙이 우선합니다.
SEO에서 robots.txt의 핵심 용도는 크롤 예산(crawl budget) 관리입니다 — 검색 결과 페이지·필터·중복 파라미터처럼 가치 낮은 URL의 크롤을 줄여, 봇이 중요한 페이지에 자원을 쓰게 합니다. 사이트가 클수록 효과가 큽니다. 봇마다 규칙을 다르게 줄 수 있어, 어떤 AI 크롤러(GPTBot·ClaudeBot 등)를 허용할지도 여기서 정합니다.
다만 robots.txt는 강제가 아니라 약속입니다. 정식 크롤러는 따르지만 악성 봇은 무시할 수 있고, 민감 정보를 가리는 보안 수단이 아닙니다 — 차단 경로를 오히려 공개하는 꼴이 됩니다. 정확한 동작은 표준(RFC 9309)과 각 검색엔진의 해석을 함께 확인해야 합니다.
흔한 오해 바로잡기
noindex(또는 인증·삭제)가 필요합니다.
/robots.txt를 열 수 있어 막을 경로를 광고하는 셈입니다. 비공개는 인증·noindex로 처리하세요.
# /robots.txt
User-agent: *
Allow: /
Disallow: /nxt-mgmt/
Sitemap: https://www.next-t.co.kr/sitemap.xml
왜 SEO에서 중요한가
크롤 예산·접근을 제어하는 기본 파일입니다. 단, 색인 차단용이 아니며 잘못 막으면 렌더·색인이 망가집니다.
외부 출처 · 더 알아보기
함께 읽기 · 넥스트티 인사이트