AI Citation Observation Log · next-t.co.kr
검색 순위가 아니라 AI·검색엔진이 이 사이트를 실제로 가져간 서버 로그를 집계했습니다. ChatGPT·Claude·Perplexity·Gemini·Google·Naver의 실시간 인용 fetch와 장기 수집(참조·색인)을 구분해 관측합니다.
검색 순위는 "보일 가능성"입니다. AI 시대엔 실제로 가져갔는지(fetch)가 더 직접적인 신호예요. 그래서 우리는 순위만이 아니라 "AI가 답변 생성·참조 후보로 실제 가져갔는가(fetch)"를 함께 봅니다. (fetch는 '가져감'이지 '이해·노출'을 보장하진 않습니다.)
그리고 이건 보통 분석 도구로는 잘 안 보입니다. 일반 웹 분석은 브라우저(JS) 기반이라 JS를 실행하지 않는 AI 봇이 누락되기 쉽거든요. 우리는 서버 로그 기반이라 JS를 안 돌리는 AI fetch까지 함께 관측합니다.
AI가 실제로 가져갔다는 건, 적어도 "답변 후보군"에 들기 시작했다는 뜻입니다(노출 보장은 아님). 그래서 우리는 이 fetch 패턴을 보고 어떤 주제·구조·페이지가 AI에 반복 참조되는지 추적합니다 — 검색 순위만 보는 것보다 AI 시대에 더 직접적인 선행 신호이기 때문입니다.
3초 요약 — AI가 우리 사이트를 실제로 가져간 흔적만 셉니다. 이번 달 답변용 실시간 인용 4,438건, 장기 참조용 수집 17,275건, 가장 많이 가져간 엔진은 ChatGPT(본 사이트 기준).
봇 요청 113,187건 = AI 인용 4,438 + AI 장기수집 17,275 + 검색봇 48,057 + 기타·분류 미정 봇 43,417. ※ 사람 방문 트래픽은 비공개입니다 — 이 리포트는 AI·검색봇 관측이 목적이라 자사 방문자 수치는 싣지 않습니다.
실시간 인용(cite) = 사용자가 질문하면 AI가 답변 문서를 만들려고 URL을 즉시 가져오는 요청 — 답변에 쓰일 가능성이 가장 높은 선행 신호. 아래 %는 "이 사이트 cite 안에서의 비중(본 사이트 기준)"입니다.
⚠️ 이 비중은 엔진의 시장 점유율이 아닙니다. 예컨대 ChatGPT 92%는 'ChatGPT 시장 점유율'이 아니라, 이 사이트(next-t.co.kr)에서 관측된 실시간 인용(fetch) 중 ChatGPT 비중입니다.
※ Google·검색 계열의 cite는 즉시 응답성 fetch(검색·AI Overview·Gemini 등 포함 가능)를 묶은 것으로, 검색과 AI의 경계가 모호할 수 있습니다. 봇 분류는 User-Agent 기준이라 엔진사 정책 변경 시 재분류될 수 있습니다.
이번 달 실시간 인용은 전부 글로벌 엔진(ChatGPT·Google·Claude·Perplexity)에서 관측됐습니다. 이번 관측 범위(next-t.co.kr · 부분 관측)에서는 국내 엔진(Naver·Kakao)의 실시간 인용(ai_cite)이 아직 관측되지 않았고, 검색 색인·장기 수집 단계에서 주로 보였습니다. 표본이 한 사이트·한 기간이라 일반화가 아니라 이 관측 범위의 사실로 읽어 주세요.
AI가 우리 콘텐츠를 "지금 답하려고" 가져갔나(cite), 즉시 답변용이 아닌 장기 참조 목적의 수집(참조·색인·캐시 후보)으로 가져갔나(crawl). ※ crawl의 실제 용도(학습·색인·캐시 등)는 업체별로 다르므로 'LLM 학습'으로 단정하지 않습니다.
이번 관측에서 AI 요청의 약 80%는 장기 수집(crawl), 20%는 실시간 답변용 인용(cite)이었습니다 — 즉 장기 수집이 실시간 인용보다 약 3.9배 많았습니다.
실시간 인용(ai_cite)의 날짜별 강도.
최다일 05-26 477건 · 최소일 05-17 126건. 급증·급감의 원인은 관측만으로 단정하지 않습니다 — 발행·외부 언급 등 가설은 반복 재현으로 확인하는 별도 영역입니다.
어떤 구조의 콘텐츠가 AI 인용을 더 받는가 — 방법론의 결과.
AI가 실시간 답변에 쓰려고 가장 자주 가져간 URL.
왜 이 페이지들이 더 자주 가져가졌는지는 관측이 아니라 가설입니다 — 주제 완결성·구조화·엔티티 밀도·내부 클러스터·실무형 정보 등을 후보로 보고 반복 재현으로 검증 중입니다(여기 수치는 '무엇이 가져가졌나'까지가 관측, '왜'는 해석 영역).
엔진별로 "이 사이트에서 실시간 답변용으로 가장 자주 가져간" 페이지 TOP 5 — 같은 사이트라도 엔진마다 선호하는 콘텐츠가 다릅니다.
답변 신호가 아닙니다. 즉시 답변용이 아니라 참조·색인·캐시 후보로 대량 수집한 페이지 — "AI가 무엇을 비축하나"를 보여줍니다. 위 인용 TOP과 다를 수 있어요.
전체 관측 기간 중 이 달에 처음 등장한 AI·검색·자동화 에이전트. AI마다 흔적을 남기는 방식이 달라, 이름·빈도가 곧 영향력 순위는 아닙니다 — "이런 곳들이 다녀갔다"는 기록으로만 보세요.
자칭(UA)만 믿지 않습니다. 봇 분류는 User-Agent로 1차 판정한 뒤, 출처 IP의 ASN(데이터센터 여부·네트워크 조직명)과 rDNS 정방향 확인으로 "자칭 UA와 실제 출처 네트워크가 맞는지"를 교차 점검합니다.
이번 관측에서 실시간 인용의 96.4%(4,278/4,438건)는 데이터센터 ASN에서 들어왔습니다 — 관측된 출처 네트워크: ChatGPT→Microsoft Corporation, Google→Google LLC, Claude→Google LLC, Perplexity→Amazon.com, Inc. rDNS가 공식 도메인까지 정방향 확인된 건 159건입니다.
※ AI 봇은 rDNS가 일정치 않아, 일치하면 검증·불일치는 '보류'(단정 안 함)로 둡니다. 또 이 ASN·rDNS는 출처 교차 점검 지표이며, 위 집계 수치를 이 신호로 걸러낸(필터) 값은 아닙니다 — 분류 근거가 UA 단일 신호가 아님을 보이기 위한 투명성 공개입니다.
측정 방법: 서버 로그의 User-Agent·요청 패턴으로 봇을 분류(ai_cite/ai_crawl/search)하고, ASN·rDNS로 출처를 교차 점검해 집계 — JS를 실행하지 않는 AI 봇까지 포착합니다. (일반 웹 분석은 브라우저 JS 기반이라 이 영역이 아예 0으로 안 잡힙니다.)
관측의 경계는 정직한 GEO 측정의 기술적 경계를, 신호 정의는 GEO Signal을 참고하세요.
생성 2026-06-07 17:27:26.
숫자 기준 안내: 화면 하단 고정 바의 "전체 누적"은 2026-05-17부터 지금까지 전 페이지·5개 엔진 봇 fetch 합계(역할 무관)이고, 이 리포트는 해당 월·역할별(ai_cite/ai_crawl/…) 집계라 두 수치의 기준이 다릅니다.