구글, 검색 결과를 퍼가서 파는 회사 고소했네요. AI 시대에 데이터 전쟁 시작됐어요.

요즘 AI 챗봇 쓰시나요? “요즘 날씨 어때?” 같은 건 쉽게 답해주는데, “요즘 20대 사이에서 핫한 주식 토론방 어디야?” 같은 최신 정보를 물어보면 가끔 맥을 못 추는 경우가 있더라고요. 그럴 때면 그 AI 뒤에서 뭔가 데이터를 긁어오고 있을 거라는 생각이 들잖아요. 그 ‘데이터 긁기’의 현장에서 큰 소동이 벌어지고 있네요.

주인공은 구글이에요. 상대는 ‘SerpApi’라는, 구글 검색 결과를 통째로 긁어다가 API(다른 프로그램이 쉽게 데이터를 가져갈 수 있게 만든 길)로 파는 회사랍니다. 마치 구글이 공짜로 차려놓은 부페 테이블에서 음식을 퍼다가 옆에서 유료로 파는 느낌이에요. 구글은 “이건 우리 이용약관도, 법도 무시하는 행위야”라며 본격적으로 소송을 제기했어요.

사실 SerpApi 같은 회사가 나온 이유는 간단해요. 구글은 자체 검색 결과를 공식 API로 제공하지 않거든요. 세상에서 가장 큰 웹 색인(인덱스)을 가지고 있는데, 그 결과물을 공식적으로 팔지는 않는 거죠. 그런데 AI 시대가 오면서 상황이 바뀌었어요. 챗봇이 똑똑해지려면 최신 웹 정보를 실시간으로 읽어야 하는데, 그 정보를 구글 검색 없이 모으기는 정말 어렵잖아요? 그래서 ‘Perplexity’ 같은 AI 스타트업은 SerpApi를 통해 구글 검색 결과를 간접적으로 사서 쓰고 있었던 거예요.

여기서 재미있는 점은, 구글이 “우리만 보호하려는 게 아니다”라고 말한다는 거예요. “우리가 긁어오는 웹사이트들도 SerpApi가 자기네 콘텐츠를 퍼가는 걸 허락한 적 없다”는 주장이에요. 맞는 말이에요. 예를 들어, 네이버 블로그나 다음 카페 글이 구글 검색에 걸렸다고 해서, 그 글이 다른 회사에 의해 무단으로 수집되어 팔려도 괜찮다는 뜻은 아니죠. 최근 레딧(Reddit)이 SerpApi와 Perplexity를 고소한 이유도 비슷했고요.

근데 진짜 아이러니한 건, 구글은 정작 레딧과는 공식 파트너십을 맺어 레딧 데이터를 자사 AI ‘제미니’에 직접 넣고 있다는 거예요. 그래서 제미니 답변에 레딧 링크가 자주 보이곤 하죠. “우리는 정당하게 모은 데이터인데, 너희는 불법적으로 모으네?” 라는 논리인 셈이에요. 솔직히, 웹사이트 주인의 권리를 보호한다는 명분도 있지만, 결국 구글 자신의 금자탑(검색 데이터)을 지키려는 속내가 가장 크다고 봐요.

이번 소송은 AI 시대의 데이터 전쟁의 서막일지도 몰라요. 지금까지는 그냥 참아왔는데, AI 회사들의 데이터 수요가 폭발하면서 불법 스크래핑이 너무 심해졌나 봐니다. 게다가 구글이 최근 반독점 소송에서 큰 타격 없이 넘어갔어요. 정부가 “구글아, 네 검색 데이터를 경쟁사에게도 제공해라”라는 강력한 조치를 피한 거죠. 만약 그 조치가 적용됐다면 SerpApi 같은 회사는 합법적인 공급자가 될 수도 있었을 텐데, 그 길이 막히니 구글이 더 당당해진 느낌이에요.

이 소식에 기뻐할 회사도 있어요. Brave나 Bing처럼 검색 API를 공식 제공하는 회사들이죠. 불법적으로 구글 데이터를 가져가는 뒷문이 막히면, 정문으로 들어와야 하니까요. 결국 AI 챗봇의 답변 품질과 비용에도 영향을 미칠 수 있는 중요한 싸움이에요.

제 생각엔, 이건 단순한 고소 고발을 넘어서는 신호탄인 것 같아요. 인터넷의 공짜 문화가 어디까지 갈 수 있는지, 누가 데이터라는 원유의 주인인지에 대한 근본적인 질문을 던지고 있거든요. 스타트업에서 일하다 보면 데이터 확보가 얼마나 중요한지 뼈저리게 느껴지는데, 앞으로 스타트업이 AI를 만들려면 데이터 조달 비용이 훨씬 더 커질 수도 있겠다는 생각이 드네요. 우리가 매일 쓰는 ‘공짜 검색’의 뒷면에선 이런 치열한 싸움이 벌어지고 있다는 게, 참 신기하면서도 좀 복잡한 느낌이에요.

원문: [Ars Technica](https://arstechnica.com/google/2025/12/google-lobs-lawsuit-at-search-result-scraping-firm-serpapi/)

위로 스크롤