세계 최대 ‘그림자 도서관’이 스포티파이 음원 300TB를 백업했다고? 음악 보존 vs 저작권 논란

요즘 음악 들으실 때 뭐 쓰시나요? 저는 개인적으로 플레이리스트 만드는 재미가 쏠쏠해서 스포티파이를 많이 쓰는 편인데요. 그런데 그 스포티파이의 데이터가 통째로 복사되어 공개됐다는 소식, 들으셨나요? 😮

세계에서 가장 큰 ‘그림자 도서관(Shadow Library)’으로 알려진 ‘안나의 아카이브(Anna’s Archive)’가 주인공이에요. 이곳은 원래 책이나 학술 논문을 무료로 공유하는 곳으로 유명했는데, 이번에는 음악 플랫폼을 노렸네요. 그들이 공개한 자료의 규모가 무려 300테라바이트(TB)라고 하니, 상상이 가시나요? 보통 외장하드 600개 분량이에요. 완전 어마어마하죠.

그들이 주장하는 건 ‘인류 음악 유산의 보존’이에요. 전쟁이나 예산 삭감, 자연재해 같은 걸로 음악 데이터가 사라질 수 있으니, 미리 백업해두자는 거죠. 실제로 스포티파이에서 가장 많이 스트리밍된 곡들의 99% 이상의 정보와, 전체 음원 파일의 약 37%를 긁어모았다고 자랑(?)하고 있어요. AI로 생성된 질 낮은 음원이나 아예 재생되지 않는 곡들은 걸러냈다고 하네요.

근데 진짜 흥미로운 건 이게 ‘누구를 위한’ 백업이냐는 점이에요. 안나의 아카이브 커뮤니티 안에서도 의견이 분분하대요. 일반 음악 팬이 300TB짜리 토렌트 파일에서 내가 듣고 싶은 한 곡만 찾아내는 건 사실상 불가능에 가깝거든요. 그러다 보니 “이건 결국 AI 회사들을 위한 데이터 수집 아니야?”라는 지적이 나오고 있어요. 메타나 앤트로픽 같은 AI 기업들이 책 데이터셋을 훈련용으로 불법 사용한 전례가 있기 때문에 더욱 의심을 사는 거죠.

당연히 스포티파이는 발끈했어요. “불법적인 스크래핑”이라고 규정하고, 관련 계정을 차단했다고 발표했죠. 또한 앞으로 이런 공격을 막을 새로운 보안 장치를 도입하겠다고 했어요. 음악가들의 권리를 보호하는 건 우리의 기본 원칙이라고 강조하더라고요.

솔직히, 기술과 저작권이 부딪히는 이 지점이 참 복잡해요. 한편으로는 디지털 시대에 문화 유산을 어떻게 안전하게 보관할지에 대한 진지한 고민이 담겨 있는 것 같기도 하고, 다른 한편으로는 분명 법적 경계를 넘어선 행위이기도 하죠. 게다가 그 사이에서 AI 학습 데이터라는 거대한 수요가 자리하고 있고요.

이번 사건은 단순한 ‘해킹’을 넘어서, 데이터가 누구의 것인지, 디지털 콘텐츠를 어떻게 보존해야 하는지, 그리고 그 과정에서 AI 기술이 어떤 역할을 하는지에 대한 거대한 질문을 던지는 것 같아요. 여러분은 어떻게 생각하시나요? 진정한 보존과 불법 복제의 경계는 어디쯤일까요?

다음에 커피 한잔 할 때 이야기해보면 재밌을 주제인 것 같네요.

원문: [Ars Technica](https://arstechnica.com/tech-policy/2025/12/worlds-largest-shadow-library-brags-it-scraped-300tb-of-spotify-music-metadata/)

위로 스크롤