알리바바 AI, 이제 내 얼굴과 목소리로 영상 만든다고? ‘완 2.6’의 충격적인 업그레이드

요즘 AI로 그림 그리거나 짧은 영상 만드는 거, 한번쯤 해보셨나요? 저는 막상 해보면 ‘내가 생각한 거랑 좀 다른데?’ 싶을 때가 많더라고요. 특히 내가 주인공이 되는 상상은 구현하기가 참 어렵잖아요.

근데 알리바바 클라우드가 이 고민을 싹 날려버릴 만한 AI 모델을 발표했어요. ‘완(Wan) 2.6’ 시리즈인데, 핵심은 정말 놀랍습니다. 내 얼굴과 내 목소리를 AI가 학습해서, 그 ‘나’를 다른 배경과 상황에 자연스럽게 등장시킬 수 있다고 해요.

예를 들어볼게요. 제가 스타벅스에서 커피 마는 5초짜리 영상 하나를 업로드하고, “사막 한가운데서 유목민처럼 걷는 모습”이라는 텍스트를 입력하면요? AI가 제 외모와 음성을 그대로 유지한 채로 사막을 배경으로 한 새로운 영상을 만들어준다는 거예요. 이건 그동안의 텍스트→영상 생성과는 완전 다른 차원의 기술이죠.

솔직히 이 기술이 실용화되면 콘텐츠 창작의 문턱이 엄청나게 낮아질 거예요. 유튜브 시작하려는 분들, 개인 브랜딩을 해야 하는 분들께는 혁명 같은 소식이에요. 전문적인 영상 제작 팀이나 고가의 장비 없이도, 나만의 독특한 스토리를 15초 길이의 영상으로 만들 수 있게 되니까요.

게다가 한 영상에 여러 사람이나 동물을 동시에 등장시키는 것도 가능해졌고, 영상의 시각적 일관성과 스토리텔링도 훨씬 자연스러워졌다고 하네요. 마치 넷플릭스 드라마 한 편을 보는 것 같은 퀄리티를 개인이 만들 수 있는 시대가 오고 있는 것 같아요.

이 모델은 알리바바의 대표 AI ‘큐원’에도 통합될 예정이라, 접근성도 점점 높아질 거예요. AI 기술 경쟁이 점점 치열해지고 있는데, 이렇게 사용자 중심의 실용적인 기능이 나오는 건 정말 반갑네요.

이제 정말 ‘누구나 크리에이터’가 될 수 있는 시대가 코앞까지 온 걸까요? 기술이 우리의 표현 방식을 어떻게 바꿔놓을지, 좀 더 지켜봐야 할 것 같아요. 하지만 분명한 건, 상상하는 대로 구현하는 것이 점점 쉬워지고 있다는 거죠. 기대되지 않나요?

원문: [전자신문](https://www.etnews.com/20251218000001)

위로 스크롤