AI Citation Observation Log · next-t.co.kr

2026년 6월 AI 인용·수집 관측 리포트

검색 순위가 아니라 AI·검색엔진이 이 사이트를 실제로 가져간 서버 로그를 집계했습니다. ChatGPT·Claude·Perplexity·Gemini·Google·Naver의 실시간 인용 fetch와 장기 수집(참조·색인)을 구분해 관측합니다.

관측 기간 2026-06-01 ~ 2026-06-30 · 봇 요청 232,488건 (부분 관측)

정직성 가드 — 두 방향 모두 단정하지 않습니다.
· 서버 로그 = AI가 페이지를 실제로 가져간 흔적. 단 가져감(fetch) ≠ 답변 노출 — 후보 문서 수집일 수도 있습니다.
· 반대로 로그가 없다고 미사용도 아닙니다 — 캐시·검색 레이어를 거칠 수 있으니까요(CCTV에 안 찍혔다고 안 왔다고 단정 못 하는 것과 같습니다).
· 그래서 한 번의 로그가 아니라 반복 재현을 봅니다. 한 사이트(next-t.co.kr)·부분 관측이라 인터넷 전체를 대표하는 통계는 아닙니다.

왜 이 숫자를 보나요?

검색 순위는 "보일 가능성"입니다. AI 시대엔 실제로 가져갔는지(fetch)가 더 직접적인 신호예요. 그래서 우리는 순위만이 아니라 "AI가 답변 생성·참조 후보로 실제 가져갔는가(fetch)"를 함께 봅니다. (fetch는 '가져감'이지 '이해·노출'을 보장하진 않습니다.)

그리고 이건 보통 분석 도구로는 잘 안 보입니다. 일반 웹 분석은 브라우저(JS) 기반이라 JS를 실행하지 않는 AI 봇이 누락되기 쉽거든요. 우리는 서버 로그 기반이라 JS를 안 돌리는 AI fetch까지 함께 관측합니다.

AI가 실제로 가져갔다는 건, 적어도 "답변 후보군"에 들기 시작했다는 뜻입니다(노출 보장은 아님). 그래서 우리는 이 fetch 패턴을 보고 어떤 주제·구조·페이지가 AI에 반복 참조되는지 추적합니다 — 검색 순위만 보는 것보다 AI 시대에 더 직접적인 선행 신호이기 때문입니다.

📖 처음이라 숫자가 어렵다면, 쉽게 푼 해설을 먼저 보세요 — 이 리포트 읽는 법 · AI가 가져가는 글은 뭐가 다를까

3초 요약 — AI가 우리 사이트를 실제로 가져간 흔적만 셉니다. 이번 달 답변용 실시간 인용 16,390건, 장기 참조용 수집 85,254건, 가장 많이 가져간 엔진은 ChatGPT(본 사이트 기준).

16,390

AI 실시간 인용 (ai_cite)

85,254

AI 장기 수집 (ai_crawl)

91,556

검색 색인봇 (search)

39,288

기타·분류 미정 봇

봇 요청 232,488건 = AI 인용 16,390 + AI 장기수집 85,254 + 검색봇 91,556 + 기타·분류 미정 봇 39,288. ※ 사람 방문 트래픽은 비공개입니다 — 이 리포트는 AI·검색봇 관측이 목적이라 자사 방문자 수치는 싣지 않습니다.

이 사이트에서 관측된 엔진별 인용 fetch 비중 (본 사이트 기준)

실시간 인용(cite) = 사용자가 질문하면 AI가 답변 문서를 만들려고 URL을 즉시 가져오는 요청 — 답변에 쓰일 가능성이 가장 높은 선행 신호. 아래 %는 "이 사이트 cite 안에서의 비중(본 사이트 기준)"입니다.

⚠️ 이 비중은 엔진의 시장 점유율이 아닙니다. 예컨대 ChatGPT 92%는 'ChatGPT 시장 점유율'이 아니라, 이 사이트(next-t.co.kr)에서 관측된 실시간 인용(fetch) 중 ChatGPT 비중입니다.

ChatGPT15,507 95% · 고유 6,751페이지

Claude512 3% · 고유 138페이지

Google294 2% · 고유 79페이지

Perplexity77 0% · 고유 36페이지

※ Google·검색 계열의 cite는 즉시 응답성 fetch(검색·AI Overview·Gemini 등 포함 가능)를 묶은 것으로, 검색과 AI의 경계가 모호할 수 있습니다. 봇 분류는 User-Agent 기준이라 엔진사 정책 변경 시 재분류될 수 있습니다.

글로벌 엔진 16,390 (100%) 국내 엔진 0 (0%)

이번 달 실시간 인용은 전부 글로벌 엔진(ChatGPT·Google·Claude·Perplexity)에서 관측됐습니다. 이번 관측 범위(next-t.co.kr · 부분 관측)에서는 국내 엔진(Naver·Kakao)의 실시간 인용(ai_cite)이 아직 관측되지 않았고, 검색 색인·장기 수집 단계에서 주로 보였습니다. 표본이 한 사이트·한 기간이라 일반화가 아니라 이 관측 범위의 사실로 읽어 주세요.

실시간 인용 vs 장기 수집

AI가 우리 콘텐츠를 "지금 답하려고" 가져갔나(cite), 즉시 답변용이 아닌 장기 참조 목적의 수집(참조·색인·캐시 후보)으로 가져갔나(crawl). ※ crawl의 실제 용도(학습·색인·캐시 등)는 업체별로 다르므로 'LLM 학습'으로 단정하지 않습니다.

cite 16% crawl 84%

이번 관측에서 AI 요청의 약 84%는 장기 수집(crawl), 16%는 실시간 답변용 인용(cite)이었습니다 — 즉 장기 수집이 실시간 인용보다 약 5.2배 많았습니다.

일별 인용 fetch 추이

실시간 인용(ai_cite)의 날짜별 강도.

2026-06-012026-06-30

최다일 06-12 6,019건 · 최소일 06-06 199건. 급증·급감의 원인은 관측만으로 단정하지 않습니다 — 발행·외부 언급 등 가설은 반복 재현으로 확인하는 별도 영역입니다.

가장 많이 인용된 영역

어떤 구조의 콘텐츠가 AI 인용을 더 받는가 — 방법론의 결과.

/blog 11,907/seo 1,887/(홈) 1,011/geo 854/web 348/keyword 187/uiux 81/company 48/about 25/contact 24

가장 많이 인용된 페이지 TOP 15

AI가 실시간 답변에 쓰려고 가장 자주 가져간 URL.

1	/	1,011
2	/seo/webmaster-tools-setup/	554
3	/blog/seo/2026년-최신-seo-최적화-방법-완전정복-가이드/	527
4	/blog/seo/2026년-최신-seo-최적화-방법-완전정복-가이드	488
5	/geo/	345
6	/keyword/	182
7	/blog/geo/국내-브랜드를-위한-생성형-ai-엔진-최적화-실전-가이드/	175
8	/seo/	165
9	/seo/ai-era-seo/	141
10	/blog/GEO/국내외-geo-대행사-및-서비스-선택-가이드	107
11	/blog/geo/국내-브랜드를-위한-생성형-ai-엔진-최적화-실전-가이드	100
12	/blog/geo/국내외-geo-대행사-및-서비스-선택-가이드/	86
13	/seo/keyword-research	80
14	/blog/데이터기술/기술-seo의-핵심-robots-txt-사이트맵-캐노니컬-태그-완벽-이해	71
15	/blog/seo/검색엔진최적화-SEO-테크니컬SEO-img-image-tag-이미지태그-alt속성/	69

왜 이 페이지들이 더 자주 가져가졌는지는 관측이 아니라 가설입니다 — 주제 완결성·구조화·엔티티 밀도·내부 클러스터·실무형 정보 등을 후보로 보고 반복 재현으로 검증 중입니다(여기 수치는 '무엇이 가져가졌나'까지가 관측, '왜'는 해석 영역).

엔진이 실제 답변에 가장 많이 가져간 페이지

엔진별로 "이 사이트에서 실시간 답변용으로 가장 자주 가져간" 페이지 TOP 5 — 같은 사이트라도 엔진마다 선호하는 콘텐츠가 다릅니다.

ChatGPT 15,507 fetch

/982
/seo/webmaster-tools-setup/547
/blog/seo/2026년-최신-seo-최적화-방법-완전정복-가이드/503
/blog/seo/2026년-최신-seo-최적화-방법-완전정복-가이드461
/geo/294

Claude 512 fetch

Google 294 fetch

Perplexity 77 fetch

장기 수집(crawl)이 가장 많이 가져간 페이지

답변 신호가 아닙니다. 즉시 답변용이 아니라 참조·색인·캐시 후보로 대량 수집한 페이지 — "AI가 무엇을 비축하나"를 보여줍니다. 위 인용 TOP과 다를 수 있어요.

1	/seo/	1,992
2	/	231
3	/web/portfolio/	122
4	/blog/geo/geo업체-우리-기업에-꼭-맞는-국내-업체-선택-가이드/	86
5	/contact/	85
6	/blog/	85
7	/blog/page/null	84
8	/blog/GEO/국내-브랜드를-위한-생성형-ai-엔진-최적화-실전-가이드/	77
9	/blog/geo/geo업체-우리-기업에-꼭-맞는-국내-업체-선택-가이드	75
10	/blog/geo/geo생성형-엔진-최적화의-핵심과-실전-적용법	72

이번 달 처음 관측된 봇

전체 관측 기간 중 이 달에 처음 등장한 AI·검색·자동화 에이전트. AI마다 흔적을 남기는 방식이 달라, 이름·빈도가 곧 영향력 순위는 아닙니다 — "이런 곳들이 다녀갔다"는 기록으로만 보세요.

discord 06-04

봇을 어떻게 가려내나 — UA + ASN + rDNS 교차 점검

자칭(UA)만 믿지 않습니다. 봇 분류는 User-Agent로 1차 판정한 뒤, 출처 IP의 ASN(데이터센터 여부·네트워크 조직명)과 rDNS 정방향 확인으로 "자칭 UA와 실제 출처 네트워크가 맞는지"를 교차 점검합니다.

이번 관측에서 실시간 인용의 95.9%(15,712/16,390건)는 데이터센터 ASN에서 들어왔습니다 — 관측된 출처 네트워크: ChatGPT→Microsoft Corporation, Claude→Google LLC, Google→Google LLC, Perplexity→Amazon.com, Inc. rDNS가 공식 도메인까지 정방향 확인된 건 294건입니다.

※ AI 봇은 rDNS가 일정치 않아, 일치하면 검증·불일치는 '보류'(단정 안 함)로 둡니다. 또 이 ASN·rDNS는 출처 교차 점검 지표이며, 위 집계 수치를 이 신호로 걸러낸(필터) 값은 아닙니다 — 분류 근거가 UA 단일 신호가 아님을 보이기 위한 투명성 공개입니다.

측정 방법: 서버 로그의 User-Agent·요청 패턴으로 봇을 분류(ai_cite/ai_crawl/search)하고, ASN·rDNS로 출처를 교차 점검해 집계 — JS를 실행하지 않는 AI 봇까지 포착합니다. (일반 웹 분석은 브라우저 JS 기반이라 이 영역이 아예 0으로 안 잡힙니다.) 관측의 경계는 정직한 GEO 측정의 기술적 경계를, 신호 정의는 GEO Signal을 참고하세요. 생성 2026-07-01 03:05:10.
숫자 기준 안내: 화면 하단 고정 바의 "전체 누적"은 2026-05-17부터 지금까지 전 페이지·5개 엔진 봇 fetch 합계(역할 무관)이고, 이 리포트는 해당 월·역할별(ai_cite/ai_crawl/…) 집계라 두 수치의 기준이 다릅니다.