[PEDIEN] 2026년 들어 한국 언론사 트래픽 지도가 보이지 않는 곳에서 다시 그려지고 있다. 검색 엔진이 아닌 AI 챗봇이 새로운 트래픽 게이트로 부상하면서다. 그러나 본지가 글로벌 인용 데이터와 한국 언론 시장 동향을 교차 분석한 결과, AI 챗봇은 같은 질문에 서로 다른 출처를 인용하고 있었다. 어떤 매체가 어떤 챗봇에 노출되느냐에 따라 향후 한국 언론의 트래픽 운명이 갈릴 가능성이 크다는 분석이다.

"ChatGPT와 Perplexity가 인용한 도메인은 11%만 겹친다"

본지가 확인한 글로벌 인용 분석 데이터에 따르면, ChatGPT와 Perplexity 두 플랫폼에서 동시에 인용되는 도메인은 전체의 11%에 불과했다.

같은 질문에 두 챗봇이 거의 다른 출처를 인용한다는 의미다.

더 흥미로운 건 인용 메커니즘 자체가 근본적으로 다르다는 점이다. 

ChatGPT는 학습 데이터 기반으로 작동한다.

Wikipedia나 공식 사이트처럼 오래 축적된 권위 있는 소스를 선호하며, 브랜드 인지도와 도메인 권위가 인용의 핵심이다.

반면 Perplexity는 실시간 웹 검색을 활용해 최신 콘텐츠를 우선시하며, AI가 인용하는 콘텐츠의 50%가 13주 이내 발행물이라는 통계가 이를 뒷받침한다.

Google AI Overview의 변화는 더 극적이다.

Top-10 페이지 인용 비중이 76%에서 38%로 급락했다.

검색 순위가 낮아도 구조화된 콘텐츠(FAQ, 비교표)라면 인용될 가능성이 생긴 것이다.

즉, 검색 SEO 1위가 더 이상 AI 인용 1위를 보장하지 않는다.

한국 언론사에 의미하는 것 — 세 갈래의 함정

이 글로벌 패턴을 한국 언론 시장에 대입하면 세 가지 구조적 함정이 드러난다.

첫째, '권위형 매체'의 ChatGPT 의존도. 조선일보·한겨레·KBS·SBS 같은 전통 매체는 ChatGPT가 선호하는 '도메인 권위' 조건에는 부합한다. 그러나 ChatGPT는 학습 시점 이후의 새 기사를 즉시 인용하지 못한다. 즉 권위형 매체는 ChatGPT에 '과거 인용은 잡되, 속보는 못 잡는' 구조에 갇힌다.

둘째, '속보형 매체'의 Perplexity 게임. 13주 이내 콘텐츠가 절반을 차지하는 Perplexity 환경에서는 발행 빈도와 최신성이 인용의 핵심이 된다. 그러나 한국 매체 대부분은 글로벌 LLM 학습·인용 인덱스에서 자주 누락된다. 한국어 콘텐츠라는 언어 장벽이 첫 번째 이유고, robots.txt나 AI 크롤러 차단 정책이 두 번째 이유다.

셋째, 'SEO 강자'의 Google AI Overview 함정. Top-10에서 38%로 떨어진 인용 비중은, 검색 순위만으로 트래픽을 유지해온 매체에게 가장 위협적이다. 2026년의 GEO(생성형 엔진 최적화)는 단순히 콘텐츠를 잘 만드는 것을 넘어, 브랜드 자체가 하나의 '신뢰할 수 있는 정보원'으로 인식되도록 온라인 평판을 종합적으로 관리하는 전략을 요구한다.

한국 언론사가 모니터링조차 못하는 현실

더 심각한 문제는 한국 언론사 대부분이 자사가 AI 챗봇에 어떻게 인용되고 있는지조차 추적하지 못한다는 점이다. Similarweb은 ChatGPT, Perplexity, CoPilot, Claude, DeepSeek, Grok 등 주요 AI 챗봇으로부터 받는 트래픽과 이를 유도한 실제 프롬프트까지 추적하는 도구를 2026년 현재 제공 중이다. 그러나 본지 취재 결과 한국 메이저 매체 다수는 이런 모니터링 도구를 도입하지 않았거나, 도입했어도 분석 인력이 없어 데이터를 활용하지 못하는 상태였다. 

이는 단순한 트래픽 손실 문제가 아니다. AI 챗봇이 한국 뉴스를 인용할 때 잘못 인용하거나 출처를 누락하는 경우까지 포착하지 못한다는 뜻이기 때문이다. AI가 한국 매체의 보도를 왜곡해 답변할 때, 그 사실을 매체가 모른 채 지나간다는 것은 신뢰도 측면에서 치명적이다.

본지가 권하는 3단계 대응

이 분기점에서 한국 언론이 취해야 할 대응을 본지는 세 단계로 정리한다.

1단계 — 모니터링 인프라 구축. Similarweb·Ahrefs·자체 로그 분석을 통해 AI 챗봇 유입 트래픽을 추적해야 한다. 인용 출처 누락이나 왜곡 사례를 발견하는 게 첫 단계다.

2단계 — 콘텐츠 구조화. Google AI Overview가 Top-10 외 페이지를 더 많이 인용하기 시작한 핵심 이유는 구조화된 콘텐츠다. FAQ 스키마, 비교표, 명확한 헤딩 구조는 더 이상 SEO만의 영역이 아니다.

3단계 — 검증 인프라 통합. AI 챗봇이 인용한 내용이 실제 기사 원문과 일치하는지 검증하는 시스템이 필요하다. 글로벌 팩트체커들이 ClaimReview 스키마를 박는 이유도 이 검증 인프라 구축의 일환이다.

전 세계가 이미 GEO(Generative Engine Optimization) 시대로 이행하고 있다.

SEO 시대의 끝이 아니라, 한 단계 위의 게임이 시작된 것이다.

한국 언론은 이 게임의 룰북을 아직 손에 쥐지 못했다.