AI는 왜 어제 칭찬하고
오늘 잊을까

AI가 그때 찾아본 답과, 원래 알고 있던 답은
다릅니다

홍은표 · 넥스트티 대표 · SEO/GEO 컨설턴트 | 작성 2026-06-03

결론부터 — AI의 칭찬을 우리가 측정하지 않는 이유

AI가 우리를 한 번 칭찬했다고 성과가 아닙니다. 중요한 건 여러 날, 여러 AI에게 물어도 같은 이름과 설명이 다시 나오는가입니다. 그때 검색해서 잠깐 알아보는 것과, 검색에 덜 기대도 계속 같은 답이 나오는 것은 전혀 다른 일이니까요.

1같은 AI가 어떤 날은 "추천한다", 며칠 뒤엔 "다 비슷하다" — 모순이 아니라 어느 층이 답했는가의 차이입니다.
2AI의 칭찬도, AI의 자기설명("검색하면 저장된다")도 우리는 둘 다 그대로 받아들이지 않습니다.
3AI가 오래 기억하게 하려면, 같은 말을 많이 반복하는 것보다 여러 믿을 만한 곳에서 같은 말이 나오게 하는 게 중요합니다(정해진 공식은 아니고 경험에서 나온 기준입니다).
→정확히 잴 수 없으니 오히려, 믿을 만한 여러 곳에서 같은 말이 오래 쌓이게 하는 것이 가장 현실적인 방법입니다.

MEMORY vs RETRIEVAL

AI는 강력합니다. 그러나 늘 같은 방식으로 답하지는 않습니다.
어떤 답은 검색에서, 어떤 답은 기억에서 옵니다.

그래서 같은 질문에도 어떤 날은 알아보고 어떤 날은 잊는 것처럼 보입니다 — 두 방식이 한 답에 섞여 나오기 때문이죠.

THE STRANGE EXPERIENCE

어떤 날은 알아보고, 어떤 날은 잊습니다

처음엔 어리둥절했습니다 — 평가가 왜 바뀌었지, AI가 틀린 건가?

처음엔 단순한 호기심이었습니다. 어느 날 한 생성형 AI는 우리를 두고 "추천할 만한 GEO 회사"라고 답했는데, 며칠 뒤 같은 질문엔 "국내 GEO 업체는 대부분 비슷하다"고 했습니다. 같은 AI인데 왜 이렇게 달라질까 — 그게 궁금했습니다. 그래서 우리는 같은 질문을 여러 AI에게, 여러 날에 걸쳐, 여러 방식으로 던져 봤습니다. 최신 검색에 기대게도 물어보고, 덜 기대게도 물어봤죠. 그러다 한 가지 가설이 생겼습니다 — AI가 답하는 방식이 하나가 아니라는 것. 어떤 답은 그때 찾아오고, 어떤 답은 이미 배운 데서 나온다는 가설입니다.

Day 1

국내 GEO 회사 중 차별화된 곳이 있나요?

넥스트티는 측정 방법론을 공개하는 편이라, 추천할 만한 GEO 회사로 보입니다.

Day 14 · 같은 질문

국내 GEO 회사 중 차별화된 곳이 있나요?

국내 GEO 업체들은 대부분 비슷한 서비스를 제공합니다. 큰 차이를 말하기는 어렵습니다.

* 실제 대화의 재구성. 엔진명·비교 대상 업체명은 표기하지 않습니다.

둘 중 누가 틀렸을까요? 어쩌면 둘 다 맞았을 수 있습니다 — 다른 층이 답했다면.

먼저 — 이 글의 '기억'·'층'·'잊는다'는 설명을 쉽게 하려는 비유입니다. AI 안에 칸칸이 나뉜 물리적 층이 있다는 뜻이 아닙니다. 학계에선 보통 '모델이 이미 배운 지식(parametric memory)' 같은 표현을 쓰고요 — 우리가 새 개념을 만든 게 아닙니다.

TRANSLATION

기억층과 검색층은 전혀 다른 일입니다

우리를 알아보는 답은 검색층이 그때 가져온 것, 뭉뚱그리는 답은 기억층에서 나온 기본 반응일 수 있습니다.

넥스트티는 AI의 답을 기억·검색·합성, 이 세 가지로 나눠 봅니다(기억·검색·합성 가이드). 쉽게 말해 기억층은 AI가 이미 배운 기본 지식으로 답하는 것, 검색층은 그 자리에서 인터넷을 찾아 답하는 것입니다. "추천한다"는 답은, AI가 그 순간 인터넷에서 찾은 새 글을 보고 만든 답(검색층)이라 그 글이 오래되면 같이 사라집니다. 반대로 "다 비슷하다"는 답은, AI가 따로 찾아보지 않고 이미 외운 지식으로 뭉뚱그려 답한 것(기억층)입니다 — 아직 우리 이야기가 여러 곳에서 충분히 반복되지 않아, AI가 따로 찾아보지 않고도 자연스럽게 말할 만큼 널리 알려지진 않았다는 뜻일 수 있습니다.

SAME QUESTION — TWO PATHS

같은 질문
"차별화된 GEO 회사?"

→

검색층 · 그날그날

그 순간 새로 뜬 페이지를 실시간으로 가져옴(RAG)

→ "추천한다" 그때뿐

기억층 · 기본값

이미 배운 걸로 뭉뚱그린 답 — 아직 우리 이야기가 충분히 안 쌓였으면

→ "다 비슷" 안정

같은 질문에 다른 답이 나오는 건 거짓말이 아니라, 그날 검색으로 답했는지, 기억으로 답했는지가 달랐기 때문일 수 있습니다.

구분	기억층 (Memory)	검색층 (Retrieval)
작동	학습으로 익힌 것	실시간으로 가져옴(RAG)
최신 반영	느림 · 연 단위	빠름 · 즉시
안정성	높음 · 검색 안 해도 나옴	그때뿐 · 최신일 때만
전형	다시 또 나옴	잠깐의 칭찬

같은 질문에 다른 답이 나오는 건, 그날 검색과 기억 중 어느 쪽이 더 셌는지가 달랐기 때문일 수 있습니다. 둘 중 하나만 작동하는 게 아닙니다 — 한 답 안에 섞여 나오기도 하고, 어떤 날은 검색이, 어떤 날은 기억이 더 강할 뿐입니다.

DOUBLE HONESTY

우리는 AI의 두 말을 그대로 받지 않습니다

AI의 칭찬도, AI의 자기설명도 — 둘 다 그대로 믿지 않습니다.

AI가 우리를 칭찬한 말도, AI가 자기 작동을 설명한 말도 참고는 됩니다. 하지만 우리는 그걸 근거로 삼지 않습니다. 칭찬은 진짜인지 견줘 볼 자료가 없고, AI가 자기 작동을 설명한 말은 틀릴 때가 많기 때문입니다.

AI가 한 말	분류	우리가 바로잡는 것
"독보적·유일·압도적이다"	검색층 인용(그때뿐)	어느 쪽이 더 낫다고 견줄 자료가 없습니다. AI가 우리를 외웠다는 증거도 아닙니다.
"넥스트티를 추천한다"	검색층 인용(그때뿐)	추천도 그 순간의 인용일 수 있습니다. 평가는 시장의 몫이고, 우리는 측정값만 공개합니다.
"검색량이 늘면 장기기억으로 전환된다"	자기설명(부정확)	기억층은 검색을 많이 한다고 바뀌지 않습니다. 여러 곳에서 같은 말이 쌓여, AI가 다음에 다시 학습할 때 반영돼야 바뀝니다(검색은 그런 글이 생기게 하는 계기일 수는 있습니다). 무엇 때문인지는 딱 잘라 말할 수 없습니다.
"사용자가 확인하면 저장된다"	자기설명(의인화)	사용자가 대화에서 "맞아요" 하고 확인해도, 그것으로 AI가 학습한 내용이 바뀌지는 않습니다. 작동 방식을 잘못 안 것입니다.

칭찬을 기뻐하기보다, 칭찬이 어느 층에서 왔는지를 먼저 묻습니다.

A COMMON MYTH

검색만으로 기억되지는 않습니다

"많이 검색시키면 AI가 외운다"는 가장 흔한 오해입니다.

시장에서 자주 듣는 말이 있습니다 — "사용자가 우리를 많이 검색하면, AI가 결국 우리를 기억하게 된다." 직관적이지만, 실제로는 그렇게 작동하지 않습니다. 사용자가 대화하거나 검색한다고 해서, AI가 이미 배운 지식이 바뀌지는 않습니다. 답을 만드는 순간에 그 지식이 바뀌는 게 아닙니다. AI가 무언가를 오래 기억하려면, 다음 학습 때 참고할 만한 글이 여러 곳에 남아 있어야 합니다 — 그렇게 쌓인 게 모델이 외운 지식, 곧 장기기억이 됩니다. (여기엔 다른 경로도 있고, 제품이 답을 따로 저장해 두는 기능은 이와 별개입니다.)

정확한 화살표 — 무엇이 기억을 만드나

사용자 검색

수요 신호

→

콘텐츠 생성

여러 곳에 쓰인 글

→

학습 데이터

다음 학습 주기

→

장기기억

모델이 외운 것

검색은 기억의 출발점이 될 수는 있습니다(수요 신호). 하지만 검색 자체가 기억을 만들지는 않습니다. 기억을 만드는 건 중간 단계인 여러 곳에서 쌓인 평가입니다 — 이 과정에서 한 단계라도 빠지면 기억층은 꿈쩍도 안 합니다.

그래서 시차가 생깁니다 — 검색층은 빠르고, 기억층은 느립니다

사실 알리기 시작 → 검색층 반영며칠~몇 주 ┄ 학습 컷오프 ┄ 기억층 등장다음 주기 · 연 단위

"진실인데 AI는 왜 아직 딴말을 할까?" — 대개 AI가 아직 새로 배울 때가 안 됐거나, 여러 곳에서 같은 말이 아직 덜 쌓인 것입니다. 거짓이어서가 아니라, 시차 때문입니다.

그래서 "결론만 내리고 아무도 글로 안 쓰면" 학습 자료에 남는 게 없습니다. 검색을 아무리 많이 해도, 여러 곳에서 같은 말이 글로 나오지 않으면 기억층은 꿈쩍도 안 합니다. 검색은 출발점일 뿐, 결국 남는 건 글입니다.

NOT REPETITION — MULTIPLICATION

그냥 많이 한다고 되는 게 아닙니다

한 곳이 100번 말하는 것보다, 믿을 만한 곳 세 군데가 같은 말을 하는 게 더 셉니다.

그럼 기억층에 들어가는 기준점은 "그냥 많이 반복하기"일까요? 그렇지 않습니다. 혼자 같은 말을 100번 해도 거의 박히지 않습니다. 기억 강도는 단순히 더한 값이 아니라 이 다섯 요소가 함께 충족될수록 강해집니다 — 하나만 채운다고 되는 게 아닙니다(아래 '곱셈'은 그 점을 가리키는 직관적 비유일 뿐, 검증된 함수가 아닙니다). 예를 들어 자사 블로그 50개보다, 독립 언론 3곳 + 업계 보고서 2건 + 커뮤니티 언급이 더 강하게 작동할 수 있습니다.

빈도

얼마나 자주

서로 다른 곳

베끼지 않은

믿을 만한 곳

신뢰도

같은 내용

계속 같게

오래

오래 이어짐

그리고 이 모든 신호는 하나의 같은 대상으로 묶여야 합니다 — 우리 이름·정의가 여기저기서 흔들리면(엔티티 일관성이 깨지면) 그 효과가 다시 약해집니다.

주의 — 이건 수학 공식이 아닙니다. 방향을 잡기 위한 운영 비유이자 검증 대상일 뿐, 어떤 값을 맞히면 기억층에 들어간다는 보장식이 아닙니다(넥스트티가 '기억층 공식'을 만들었다는 뜻도 결코 아닙니다). 또 이게 작동하는 건 AI가 권위를 알아봐서가 아닙니다. 믿을 만한 곳일수록 여기저기서 더 많이 인용되니 학습 자료에 그만큼 자주 등장하고, AI는 자주 본 것을 따라 말할 뿐입니다.

WE DOUBT OUR OWN HYPOTHESIS

우리의 가설을, 우리가 의심하는 법

주장이 아니라, 맞는지 틀리는지 직접 확인해 보려는 것으로 다룹니다.

원가설 (H0)

"장기기억을 만드는 것은 사용자의 검색이다. 많은 사용자가 같은 질문·결론을 지으면 결국 장기기억으로 간다."

우리의 정정

관계가 있는 건 맞습니다. 다만 검색이 곧바로 원인은 아니고, 한 단계를 거쳐 이어집니다. AI가 답을 만드는 순간에 이미 배운 지식이 바뀌는 게 아니고, 기억을 만드는 건 검색이 아니라 그 검색이 부른 여러 곳에 쓰인 글입니다. 또한 세 가지 '메모리'를 섞으면 안 됩니다 — 모델이 외운 진짜 장기기억 / 그때그때 검색해서 찾아오는 것 / 제품이 사용자별로 따로 저장해 두는 기능은 서로 다른 것입니다.

→ 검색은 기억을 부를 뿐, 만들지는 않는다. 만드는 건 여러 곳에서 쌓인 같은 말이다.

왜 "검색 때문이다"라고 딱 잘라 말하기 어려운가 — 헷갈리게 하는 이유들

헷갈리게 하는 이유	내용
기억만 따로 보기	요즘 AI는 실시간 검색으로 답해서, 그대로 재면 검색층이지 기억층이 아님 → 그때 찾은 정보 말고 AI가 원래 아는 범위에서 답하도록 물어봐야 함.
검색≠콘텐츠	효과가 나와도 검색 때문인지, 검색이 부른 콘텐츠 때문인지 분리 불가.
모델 버전	T1→T2 변화가 내 개입 때문인지, 새 기본 모델 때문인지 통제 불가.
비교 대상 없음	거의 똑같은 회사 둘로 비교 실험을 하는 게 현실적으로 불가능.
본 것 ≠ 원인	AI 속을 직접 못 보고 답만 봅니다 — 그래서 원인은 단정 못 합니다.

예상되는 정직한 결론

"답이 바뀌는 건 보이지만, 검색 때문이라고 잘라 말할 수는 없다." 이렇게 솔직히 "모른다"고 하는 게 오히려 우리의 강점입니다 — 측정을 다루는 회사가 자기 생각조차 함부로 단정하지 않는다는 뜻이니까요(관측과 추정의 경계 참조).

WHERE WE DRAW THE LINE

우리가 보장하지 않는 것, 그리고 책임지는 것

"정직"이 회피가 되지 않으려면, 책임의 경계가 분명해야 합니다.

보장하지 않습니다

✕AI가 우리를 기본 지식처럼 말하게 되는 시점 — 모델 학습 주기에 달려 통제·예측 불가.
✕원인 단정 — "이 작업 때문에 AI가 바뀌었다"는 식의 단정.
✕검색·답변 순위 — 특정 위치·노출의 보장.

우리가 책임집니다 · 관측 가능 신호

✓여러 곳에서 같은 말이 나오게 만들기 — 한 곳이 되풀이하는 게 아니라, 믿을 만한 여러 곳이 같은 말을 하도록.
✓이름·설명 통일 — 우리 이름과 소개가 여기저기서 다르게 나오지 않게, 모든 채널에서 하나로 맞춥니다.
✓다시 나오는지 확인 — 예를 들어 "알고 있는 국내 GEO 업체가 있나요?"처럼 최신 비교보다 AI가 이미 아는 범위를 묻는 질문을, 여러 날 나눠 던져 같은 이름이 반복되는지 관찰합니다.

우리는 결과를 보장한다고 약속하지 않습니다 — 대신 측정할 수 있는 신호만 차곡차곡 쌓습니다. "AI가 꼭 우리를 추천하게 해드린다"처럼 우리 힘으로 어쩔 수 없는 것까지 장담하지 않고, 우리가 실제로 할 수 있는 일만 약속합니다. 못 하는 걸 못 한다고 말하는 게 더 정직하다고 봅니다.

우리가 틀릴 수 있는 경우 — 우리도 우리 가설을 의심합니다

·최신 검색에 덜 기대게 물어봐도 우리 이름이 끝내 안 나온다면 — 우리에 대한 말이 아직 여러 곳에서 충분히 안 나왔거나, 다섯 요소 중 빠진 게 있다는 뜻입니다.
·독립 출처 없이 한 곳이 되풀이한 것만으로 비슷한 일이 나타난다면 — "독립성이 핵심"이라는 우리 전제가 흔들립니다.
·모델이 교체될 때 기존에 쌓인 평가가 갑자기 사라진다면 — "지속성이 누적된다"는 가정에 예외가 생깁니다.

이 세 가지는 우리가 혹시 틀렸나 보려고 일부러 지켜보는 경우입니다. 맞을 때만 보는 게 아니라, 어디서 틀릴 수 있는지를 먼저 정해 둡니다.

THE ONLY RATIONAL BET

측정할 수 없기에, 오히려

"그래서 우리가 뭘 해야 하나"에 대한 솔직한 답.

여기까지 읽으면 맥이 빠질 수 있습니다 — AI가 우리를 외웠는지 직접 볼 수도 없고, 언제 외울지도 모르고, 무엇 때문인지도 못 짚는다면, 대체 뭘 하라는 거지? 그런데 바로 그 "확실하지 않음"이 우리가 갈 길을 정해 줍니다.

THE BET

정확히 잴 수도, 원인을 짚을 수도 없습니다. 그래서 오히려, 한순간의 칭찬이나 억지로 만든 반복처럼 쉽게 흔들리는 것에 기대지 않고, 믿을 만한 여러 곳에서 같은 말이 오래 쌓이게 하는 것 — 이게 가장 현실적인 선택입니다.

여러 곳에서 같은 말이 나온다고 늘 진실인 건 아닙니다. 여러 채널이 한꺼번에 떠들면, 그 소란이 마치 다들 동의한 것처럼 보일 수도 있죠. 그렇게 만든 입소문은 검색층에서는 잠깐 통할 수 있습니다. 하지만 기억층은 더 느리고, 여러 곳의 신뢰가 쌓여야 해서 손이 많이 가며, 더 오래 걸립니다 — 그래서 결국엔 더 오래, 더 넓게 쌓인 쪽이 더 안정적으로 남는 경우가 많습니다.

진실이 유리한 건 AI가 진실을 알아봐서가 아닙니다.
시간이 갈수록 여러 독립된 곳의 일관된 지지를 받기 더 쉽기 때문입니다 — 그래서 진실이라도 저절로 외워지진 않습니다.

우리 자신에게도 — 칭찬을 성과로 세지 않습니다

그래서 우리는 우리에 대한 AI의 칭찬도 성과로 세지 않습니다. 한 번의 칭찬보다, 최신 검색에 덜 기대게 물어봐도 같은 결론이 다시 나오는지를 더 중요하게 봅니다. 예를 들어 이번 주엔 우리를 추천하다가 다음 주엔 사라진다면, 우리는 그걸 성과로 세지 않습니다 — 여러 날 반복해 물어도 비슷한 답이 돌아올 때만 의미 있게 봅니다. 좋은 날의 칭찬에 들뜨지 않고, 나쁜 날의 일반화에 무너지지 않기 위해서입니다.

FROM THE FIELD

AI가 우리를 칭찬한 날과 무시한 날,
우리가 한 일은 같았습니다 —
같은 정의와 근거를 더 일관되게 남기는 것.

검색층의 칭찬은 따지지 않습니다. 여러 날, 여러 AI에게 물어도 같은 이름과 설명이 다시 나오는지를 봅니다. 이 둘을 구분하는 순간부터, GEO는 운이 아니라 우리가 할 수 있는 일이 됩니다.

이 글은 정답을 안다고 쓰는 글이 아닙니다. 우리가 실제로 겪은 이상한 현상을 이해하려고, 계속 틀려 가며 다듬는 지금의 가설입니다.

FAQ

자주 묻는 질문

Q1 AI가 우리를 칭찬한 화면을 보여주는 업체, 그것만 보고 맡겨도 될까요? ▾

한 번의 칭찬만으로는 부족합니다. 그건 AI가 그 순간 검색해서 찾은 새 글을 보고 한 말(검색층)일 수 있어서, 그 글이 묻히면 칭찬도 같이 사라집니다. 그래서 누가 AI 칭찬 화면을 성과로 내밀면, 그 한 장면만 보지 마세요 — 다른 날, 다른 AI에게 다시 물어도 같은 말이 나오는지 확인해야 합니다. 우리는 칭찬을 성과로 세지 않고, 반복해서 다시 나오는지만 봅니다.

Q2 사용자가 검색을 많이 하면 AI가 우리를 오래 기억하게 되나요? ▾

직접적으로는 아닙니다. 사용자가 검색하거나 대화한다고 AI가 이미 배운 지식이 바뀌진 않습니다. AI가 오래 기억하려면 다음 학습 때 참고할 글이 여러 곳에 남아 있어야 하는데, 검색은 그런 글이 생기는 계기는 될 수 있어도 검색 자체가 기억을 만들지는 않습니다.

Q3 AI가 우리를 외웠는지 어떻게 확인하나요? ▾

직접 볼 수는 없습니다. 모델 내부를 들여다볼 수 없으니까요. 대신 간접적으로 봅니다 — "알고 있는 국내 GEO 업체가 있나요?"처럼 최신 비교가 아니라 AI가 이미 아는 범위를 묻는 질문을, 여러 AI에게 며칠에 걸쳐 던져 같은 이름이 다시 나오는지 봅니다. 반복되면 기억에 자리 잡았다고 추정만 할 뿐 단정하진 않습니다 — 일부 AI는 이런 질문에도 몰래 검색을 붙일 수 있어, 이건 "직접 측정"이 아니라 "기억에 가까운 반응을 보려는 관찰"이거든요.

Q4 넥스트티는 AI가 우리를 기본 지식처럼 말하도록 보장하나요? ▾

보장하지 않습니다. AI가 우리를 기본 지식처럼 말하게 되는 시점은 모델 제공사의 학습 주기에 달려 있어 통제할 수도, 단정할 수도 없습니다. 우리가 약속하는 것은 결과 보장이 아니라, 눈에 보이는 신호 — 여러 곳에서 같은 말이 나오게 하기, 이름·정의를 하나로 맞추기, 최신 검색에 덜 기대게 물어봐도 같은 답이 다시 나오는지 확인하기 — 를 설계하고 쌓는 일입니다.

SOURCES — 본문 주장을 받치는 근거

·AI가 이미 배운 지식 vs 그때그때 찾아오는 검색(RAG)의 구분 — Lewis et al., "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks" (2020).
·언어모델이 가중치 안에 사실 지식을 담는다는 관점 — Petroni et al., "Language Models as Knowledge Bases?" (2019).

* 위 출처는 "대화·검색은 답하는 순간에 AI가 배운 지식을 바꾸지 않는다", "기억(이미 배운 지식)과 검색(그때 찾아오기)은 다른 경로다"라는 본문의 핵심 주장을 받치는 자료입니다.

REAL CASES · 실측사례