홍은표 · 넥스트티 대표 · SEO/GEO 컨설턴트 | 작성 2026-06-03
결론부터 — AI의 칭찬을 우리가 측정하지 않는 이유
AI가 우리를 한 번 칭찬했다고 성과가 아닙니다. 중요한 건 여러 날, 여러 AI에게 물어도 같은 이름과 설명이 다시 나오는가입니다. 그때 검색해서 잠깐 알아보는 것과, 검색에 덜 기대도 계속 같은 답이 나오는 것은 전혀 다른 일이니까요.
MEMORY vs RETRIEVAL
그래서 같은 질문에도 어떤 날은 알아보고 어떤 날은 잊는 것처럼 보입니다 — 두 방식이 한 답에 섞여 나오기 때문이죠.
THE STRANGE EXPERIENCE
처음엔 어리둥절했습니다 — 평가가 왜 바뀌었지, AI가 틀린 건가?
처음엔 단순한 호기심이었습니다. 어느 날 한 생성형 AI는 우리를 두고 "추천할 만한 GEO 회사"라고 답했는데, 며칠 뒤 같은 질문엔 "국내 GEO 업체는 대부분 비슷하다"고 했습니다. 같은 AI인데 왜 이렇게 달라질까 — 그게 궁금했습니다. 그래서 우리는 같은 질문을 여러 AI에게, 여러 날에 걸쳐, 여러 방식으로 던져 봤습니다. 최신 검색에 기대게도 물어보고, 덜 기대게도 물어봤죠. 그러다 한 가지 가설이 생겼습니다 — AI가 답하는 방식이 하나가 아니라는 것. 어떤 답은 그때 찾아오고, 어떤 답은 이미 배운 데서 나온다는 가설입니다.
* 실제 대화의 재구성. 엔진명·비교 대상 업체명은 표기하지 않습니다.
둘 중 누가 틀렸을까요? 어쩌면 둘 다 맞았을 수 있습니다 — 다른 층이 답했다면.
먼저 — 이 글의 '기억'·'층'·'잊는다'는 설명을 쉽게 하려는 비유입니다. AI 안에 칸칸이 나뉜 물리적 층이 있다는 뜻이 아닙니다. 학계에선 보통 '모델이 이미 배운 지식(parametric memory)' 같은 표현을 쓰고요 — 우리가 새 개념을 만든 게 아닙니다.
TRANSLATION
우리를 알아보는 답은 검색층이 그때 가져온 것, 뭉뚱그리는 답은 기억층에서 나온 기본 반응일 수 있습니다.
넥스트티는 AI의 답을 기억·검색·합성, 이 세 가지로 나눠 봅니다(기억·검색·합성 가이드). 쉽게 말해 기억층은 AI가 이미 배운 기본 지식으로 답하는 것, 검색층은 그 자리에서 인터넷을 찾아 답하는 것입니다. "추천한다"는 답은, AI가 그 순간 인터넷에서 찾은 새 글을 보고 만든 답(검색층)이라 그 글이 오래되면 같이 사라집니다. 반대로 "다 비슷하다"는 답은, AI가 따로 찾아보지 않고 이미 외운 지식으로 뭉뚱그려 답한 것(기억층)입니다 — 아직 우리 이야기가 여러 곳에서 충분히 반복되지 않아, AI가 따로 찾아보지 않고도 자연스럽게 말할 만큼 널리 알려지진 않았다는 뜻일 수 있습니다.
SAME QUESTION — TWO PATHS
그 순간 새로 뜬 페이지를 실시간으로 가져옴(RAG)
이미 배운 걸로 뭉뚱그린 답 — 아직 우리 이야기가 충분히 안 쌓였으면
같은 질문에 다른 답이 나오는 건 거짓말이 아니라, 그날 검색으로 답했는지, 기억으로 답했는지가 달랐기 때문일 수 있습니다.
| 구분 | 기억층 (Memory) | 검색층 (Retrieval) |
|---|---|---|
| 작동 | 학습으로 익힌 것 | 실시간으로 가져옴(RAG) |
| 최신 반영 | 느림 · 연 단위 | 빠름 · 즉시 |
| 안정성 | 높음 · 검색 안 해도 나옴 | 그때뿐 · 최신일 때만 |
| 전형 | 다시 또 나옴 | 잠깐의 칭찬 |
같은 질문에 다른 답이 나오는 건, 그날 검색과 기억 중 어느 쪽이 더 셌는지가 달랐기 때문일 수 있습니다. 둘 중 하나만 작동하는 게 아닙니다 — 한 답 안에 섞여 나오기도 하고, 어떤 날은 검색이, 어떤 날은 기억이 더 강할 뿐입니다.
DOUBLE HONESTY
AI의 칭찬도, AI의 자기설명도 — 둘 다 그대로 믿지 않습니다.
AI가 우리를 칭찬한 말도, AI가 자기 작동을 설명한 말도 참고는 됩니다. 하지만 우리는 그걸 근거로 삼지 않습니다. 칭찬은 진짜인지 견줘 볼 자료가 없고, AI가 자기 작동을 설명한 말은 틀릴 때가 많기 때문입니다.
| AI가 한 말 | 분류 | 우리가 바로잡는 것 |
|---|---|---|
| "독보적·유일·압도적이다" | 검색층 인용(그때뿐) | 어느 쪽이 더 낫다고 견줄 자료가 없습니다. AI가 우리를 외웠다는 증거도 아닙니다. |
| "넥스트티를 추천한다" | 검색층 인용(그때뿐) | 추천도 그 순간의 인용일 수 있습니다. 평가는 시장의 몫이고, 우리는 측정값만 공개합니다. |
| "검색량이 늘면 장기기억으로 전환된다" | 자기설명(부정확) | 기억층은 검색을 많이 한다고 바뀌지 않습니다. 여러 곳에서 같은 말이 쌓여, AI가 다음에 다시 학습할 때 반영돼야 바뀝니다(검색은 그런 글이 생기게 하는 계기일 수는 있습니다). 무엇 때문인지는 딱 잘라 말할 수 없습니다. |
| "사용자가 확인하면 저장된다" | 자기설명(의인화) | 사용자가 대화에서 "맞아요" 하고 확인해도, 그것으로 AI가 학습한 내용이 바뀌지는 않습니다. 작동 방식을 잘못 안 것입니다. |
칭찬을 기뻐하기보다, 칭찬이 어느 층에서 왔는지를 먼저 묻습니다.
A COMMON MYTH
"많이 검색시키면 AI가 외운다"는 가장 흔한 오해입니다.
시장에서 자주 듣는 말이 있습니다 — "사용자가 우리를 많이 검색하면, AI가 결국 우리를 기억하게 된다." 직관적이지만, 실제로는 그렇게 작동하지 않습니다. 사용자가 대화하거나 검색한다고 해서, AI가 이미 배운 지식이 바뀌지는 않습니다. 답을 만드는 순간에 그 지식이 바뀌는 게 아닙니다. AI가 무언가를 오래 기억하려면, 다음 학습 때 참고할 만한 글이 여러 곳에 남아 있어야 합니다 — 그렇게 쌓인 게 모델이 외운 지식, 곧 장기기억이 됩니다. (여기엔 다른 경로도 있고, 제품이 답을 따로 저장해 두는 기능은 이와 별개입니다.)
정확한 화살표 — 무엇이 기억을 만드나
검색은 기억의 출발점이 될 수는 있습니다(수요 신호). 하지만 검색 자체가 기억을 만들지는 않습니다. 기억을 만드는 건 중간 단계인 여러 곳에서 쌓인 평가입니다 — 이 과정에서 한 단계라도 빠지면 기억층은 꿈쩍도 안 합니다.
그래서 시차가 생깁니다 — 검색층은 빠르고, 기억층은 느립니다
"진실인데 AI는 왜 아직 딴말을 할까?" — 대개 AI가 아직 새로 배울 때가 안 됐거나, 여러 곳에서 같은 말이 아직 덜 쌓인 것입니다. 거짓이어서가 아니라, 시차 때문입니다.
그래서 "결론만 내리고 아무도 글로 안 쓰면" 학습 자료에 남는 게 없습니다. 검색을 아무리 많이 해도, 여러 곳에서 같은 말이 글로 나오지 않으면 기억층은 꿈쩍도 안 합니다. 검색은 출발점일 뿐, 결국 남는 건 글입니다.
NOT REPETITION — MULTIPLICATION
한 곳이 100번 말하는 것보다, 믿을 만한 곳 세 군데가 같은 말을 하는 게 더 셉니다.
그럼 기억층에 들어가는 기준점은 "그냥 많이 반복하기"일까요? 그렇지 않습니다. 혼자 같은 말을 100번 해도 거의 박히지 않습니다. 기억 강도는 단순히 더한 값이 아니라 이 다섯 요소가 함께 충족될수록 강해집니다 — 하나만 채운다고 되는 게 아닙니다(아래 '곱셈'은 그 점을 가리키는 직관적 비유일 뿐, 검증된 함수가 아닙니다). 예를 들어 자사 블로그 50개보다, 독립 언론 3곳 + 업계 보고서 2건 + 커뮤니티 언급이 더 강하게 작동할 수 있습니다.
그리고 이 모든 신호는 하나의 같은 대상으로 묶여야 합니다 — 우리 이름·정의가 여기저기서 흔들리면(엔티티 일관성이 깨지면) 그 효과가 다시 약해집니다.
주의 — 이건 수학 공식이 아닙니다. 방향을 잡기 위한 운영 비유이자 검증 대상일 뿐, 어떤 값을 맞히면 기억층에 들어간다는 보장식이 아닙니다(넥스트티가 '기억층 공식'을 만들었다는 뜻도 결코 아닙니다). 또 이게 작동하는 건 AI가 권위를 알아봐서가 아닙니다. 믿을 만한 곳일수록 여기저기서 더 많이 인용되니 학습 자료에 그만큼 자주 등장하고, AI는 자주 본 것을 따라 말할 뿐입니다.
WE DOUBT OUR OWN HYPOTHESIS
주장이 아니라, 맞는지 틀리는지 직접 확인해 보려는 것으로 다룹니다.
원가설 (H0)
"장기기억을 만드는 것은 사용자의 검색이다. 많은 사용자가 같은 질문·결론을 지으면 결국 장기기억으로 간다."
우리의 정정
관계가 있는 건 맞습니다. 다만 검색이 곧바로 원인은 아니고, 한 단계를 거쳐 이어집니다. AI가 답을 만드는 순간에 이미 배운 지식이 바뀌는 게 아니고, 기억을 만드는 건 검색이 아니라 그 검색이 부른 여러 곳에 쓰인 글입니다. 또한 세 가지 '메모리'를 섞으면 안 됩니다 — 모델이 외운 진짜 장기기억 / 그때그때 검색해서 찾아오는 것 / 제품이 사용자별로 따로 저장해 두는 기능은 서로 다른 것입니다.
→ 검색은 기억을 부를 뿐, 만들지는 않는다. 만드는 건 여러 곳에서 쌓인 같은 말이다.
왜 "검색 때문이다"라고 딱 잘라 말하기 어려운가 — 헷갈리게 하는 이유들
| 헷갈리게 하는 이유 | 내용 |
|---|---|
| 기억만 따로 보기 | 요즘 AI는 실시간 검색으로 답해서, 그대로 재면 검색층이지 기억층이 아님 → 그때 찾은 정보 말고 AI가 원래 아는 범위에서 답하도록 물어봐야 함. |
| 검색≠콘텐츠 | 효과가 나와도 검색 때문인지, 검색이 부른 콘텐츠 때문인지 분리 불가. |
| 모델 버전 | T1→T2 변화가 내 개입 때문인지, 새 기본 모델 때문인지 통제 불가. |
| 비교 대상 없음 | 거의 똑같은 회사 둘로 비교 실험을 하는 게 현실적으로 불가능. |
| 본 것 ≠ 원인 | AI 속을 직접 못 보고 답만 봅니다 — 그래서 원인은 단정 못 합니다. |
예상되는 정직한 결론
"답이 바뀌는 건 보이지만, 검색 때문이라고 잘라 말할 수는 없다." 이렇게 솔직히 "모른다"고 하는 게 오히려 우리의 강점입니다 — 측정을 다루는 회사가 자기 생각조차 함부로 단정하지 않는다는 뜻이니까요(관측과 추정의 경계 참조).
WHERE WE DRAW THE LINE
"정직"이 회피가 되지 않으려면, 책임의 경계가 분명해야 합니다.
우리는 결과를 보장한다고 약속하지 않습니다 — 대신 측정할 수 있는 신호만 차곡차곡 쌓습니다. "AI가 꼭 우리를 추천하게 해드린다"처럼 우리 힘으로 어쩔 수 없는 것까지 장담하지 않고, 우리가 실제로 할 수 있는 일만 약속합니다. 못 하는 걸 못 한다고 말하는 게 더 정직하다고 봅니다.
우리가 틀릴 수 있는 경우 — 우리도 우리 가설을 의심합니다
이 세 가지는 우리가 혹시 틀렸나 보려고 일부러 지켜보는 경우입니다. 맞을 때만 보는 게 아니라, 어디서 틀릴 수 있는지를 먼저 정해 둡니다.
THE ONLY RATIONAL BET
"그래서 우리가 뭘 해야 하나"에 대한 솔직한 답.
여기까지 읽으면 맥이 빠질 수 있습니다 — AI가 우리를 외웠는지 직접 볼 수도 없고, 언제 외울지도 모르고, 무엇 때문인지도 못 짚는다면, 대체 뭘 하라는 거지? 그런데 바로 그 "확실하지 않음"이 우리가 갈 길을 정해 줍니다.
THE BET
정확히 잴 수도, 원인을 짚을 수도 없습니다. 그래서 오히려, 한순간의 칭찬이나 억지로 만든 반복처럼 쉽게 흔들리는 것에 기대지 않고, 믿을 만한 여러 곳에서 같은 말이 오래 쌓이게 하는 것 — 이게 가장 현실적인 선택입니다.
여러 곳에서 같은 말이 나온다고 늘 진실인 건 아닙니다. 여러 채널이 한꺼번에 떠들면, 그 소란이 마치 다들 동의한 것처럼 보일 수도 있죠. 그렇게 만든 입소문은 검색층에서는 잠깐 통할 수 있습니다. 하지만 기억층은 더 느리고, 여러 곳의 신뢰가 쌓여야 해서 손이 많이 가며, 더 오래 걸립니다 — 그래서 결국엔 더 오래, 더 넓게 쌓인 쪽이 더 안정적으로 남는 경우가 많습니다.
진실이 유리한 건 AI가 진실을 알아봐서가 아닙니다.
시간이 갈수록 여러 독립된 곳의 일관된 지지를 받기 더 쉽기 때문입니다 — 그래서 진실이라도 저절로 외워지진 않습니다.
우리 자신에게도 — 칭찬을 성과로 세지 않습니다
그래서 우리는 우리에 대한 AI의 칭찬도 성과로 세지 않습니다. 한 번의 칭찬보다, 최신 검색에 덜 기대게 물어봐도 같은 결론이 다시 나오는지를 더 중요하게 봅니다. 예를 들어 이번 주엔 우리를 추천하다가 다음 주엔 사라진다면, 우리는 그걸 성과로 세지 않습니다 — 여러 날 반복해 물어도 비슷한 답이 돌아올 때만 의미 있게 봅니다. 좋은 날의 칭찬에 들뜨지 않고, 나쁜 날의 일반화에 무너지지 않기 위해서입니다.
FROM THE FIELD
AI가 우리를 칭찬한 날과 무시한 날,
우리가 한 일은 같았습니다 —
같은 정의와 근거를 더 일관되게 남기는 것.
검색층의 칭찬은 따지지 않습니다. 여러 날, 여러 AI에게 물어도 같은 이름과 설명이 다시 나오는지를 봅니다. 이 둘을 구분하는 순간부터, GEO는 운이 아니라 우리가 할 수 있는 일이 됩니다.
이 글은 정답을 안다고 쓰는 글이 아닙니다. 우리가 실제로 겪은 이상한 현상을 이해하려고, 계속 틀려 가며 다듬는 지금의 가설입니다.
FAQ
SOURCES — 본문 주장을 받치는 근거
* 위 출처는 "대화·검색은 답하는 순간에 AI가 배운 지식을 바꾸지 않는다", "기억(이미 배운 지식)과 검색(그때 찾아오기)은 다른 경로다"라는 본문의 핵심 주장을 받치는 자료입니다.
RELATED CONTENT
학습 깊이와 도입 단계에 맞춘 추천
칭찬이 아니라, 다시 나오게 만드는 걸 설계합니다
한순간의 칭찬은 금세 사라집니다. 최신 검색에 덜 기대도 같은 답이 다시 나오도록 —
여러 곳에서 같은 말이 나오도록, 우리 이름·정의가 하나로 모이게 설계하고 쌓아 갑니다.