시댄스 2.0을 이용해 톰 크루즈와 브래드 피트가 격투하는 영상 캡처.
배우 톰 크루즈와 브래드 피트가 주먹다짐하는 모습이 담긴 20초 분량의 영상이 지난 2월에 공개돼 온라인에서 화제였다. 중국의 미디어 기업 바이트댄스(ByteDance, 字節跳動)의 AI 영상 생성 모델 ‘시댄스 2.0’을 이용해 제작된 영상이다. 주로 애니메이션 분야에서 활약해온 아일랜드 영화감독 루아이리 로빈슨이 제작한 것으로 알려졌다. 이 영상 속에는 <뱀파이어와의 인터뷰>(1994) 이후 같은 영화에 출연한 적 없는 할리우드의 유명 배우 톰 크루즈와 브래드 피트가 가죽 재킷을 입은 채 등장해 건물 옥상에서 콘크리트 먼지를 일으키며 싸운다.
해당 영상이 온라인에서 이목을 끌자 할리우드영화계는 즉각 반발하고 나섰다. 미국영화협회는 “미 저작권 작품을 대규모로 무단 사용했다”라고 비판했고 디즈니, 파라마운트, 워너브러더스 등 대형 스튜디오들은 AI 회사측에 저작물 사용 중단을 요구하는 서한을 발송했으며, 미국 배우조합은 “예술가들의 생계를 저해하는 행위”라고 목소리를 냈다. 일반 관객들은 해당 영상이 우리의 눈을 속일 만큼 그럴듯하다는 점에 주목할지 모르나 할리우드에서는 저작권을 문제 삼은 것이다. 이에 바이트댄스는 실제 인물의 이미지를 업로드하는 기능을 중단하기에 이르렀다.
그렇다면 시각효과 전문가들의 눈에 시댄스 2.0의 완성도는 어느 수준일까. 할리우드 대형 영화에서 VFX를 담당하는 A디자이너는 “매달 새로운 게 나오고 바뀌고 있어서 누구도 정확하게 예측하기는 힘들다”면서도 “아직은 상업영화에 쓰기에는 무리가 있다”라고 말한다. <화이> <베테랑> <서울의 봄> <레이디 두아> 등의 오프닝을 책임진 모션그래퍼 조경훈 언디자인드 뮤지엄 대표도 해당 영상을 보고 “제법 움직인다고 생각했지만 아직 AI 영상이란 티가 역력했다”라고 표현한다.
우선 AI로 만든 영상들은 기존 3D VFX 기술로 제작한 결과물보다 완성도가 떨어지기 때문이다. 해상도부터 낮다. A디자이너는 “AI는 데이터들을 긁어모아 학습해서 결과물을 낸다. 그러다 보니 해상도가 낮을 수밖에 없다”라고 설명한다. A디자이너는 시댄스 2.0과 같은 생성형 AI 기술로는 창작자가 원하는 이미지를 제대로 만들어낼 수 없다며 “할리우드 블록버스터영화의 감독과 제작자 등 영화인들은 특별한 자기만의 비주얼을 꿈꾸기 마련이다. 상상한 비주얼을 만들어내기에 AI로는 한계가 있다”라고 말한다. 그는 이번에 화제를 모은 톰 크루즈와 브래드 피트의 격투 영상 역시 기존에 우리가 ‘본 듯한’ 이미지였을 뿐 완전히 새로운 이미지는 아니라고 말했다. 그래서일까. 제임스 캐머런처럼 새로운 시각효과 기술에 관심이 많은 창작자들도 AI를 이용해 극장 개봉 영화를 만든다는 이야기는 아직 들려오지 않는다.
A디자이너는 AI 영상으로 만든 영상의 작업 방식을 설명하며 중간에 수정하는 과정이 쉽지 않다고 말한다. “AI로 생성한 영상을 다듬어나가려고 해도 잘 구현되지 않는다. 일반적인 이미지는 만들어낼 수 있지만 굉장히 구석구석 특정하게 이미지의 디테일을 살리기에는 아직 무리다. AI가 만들어놓은 데이터를 가지고 3D 작업을 시도하기도 어렵다. 처음부터 근육과 뼈의 움직임을 구현하는 모델링 작업을 다시 해야 한다. 차라리 3D로 처음부터 시작하면 이렇게 시간이 오래 걸리지는 않을 일이다.”
톰 크루즈와 브래드 피트의 격투 영상을 자세히 보면 어딘지 모르게 이상하다. 톰 크루즈가 브래드 피트를 밀쳐 넘어뜨리는 순간 연결이 튀고, 검은 가죽 재킷을 입고 있던 톰 크루즈가 어느새 검은 반팔을 입고 있다. 그 반짝하는 차이가 눈에 띈다. 할리우드 배우들의 얼굴에 집중하다보면 놓치기 쉽지만 20초 분량의 짧은 영상에서조차 결이 맞지 않는 것이다. 마우스를 한번 딸깍해 간단하게 수정할 수 있다면 로빈슨 감독은 이런 일종의 이격을 왜 다듬지 않았을까. 혹은 이 정도의 이질감이 시댄스 2.0으로 만들어낼 수 있는 최선의 결과물이 아닐까. 시댄스 2.0의 영상에서는 많이 완화됐으나 AI로 만든 영상 특유의 뭉개짐 역시 장벽이다. A디자이너는 생성형 AI의 작동 방식에 의한 부작용으로 이미지가 뭉개진다고 설명한다. “합성에 쓰이는 예전 영화들은 현재 관객의 눈에는 저화질일 수밖에 없다. 예전 영상들을 학습하다보니 2K, 혹은 그보다 낮은 화질의 영상이 이용되기 마련이고 이를 업스케일링하는 데 한계가 있어 이미지가 뭉개지는 것이다.”
AI 기술은 저예산 영화나 드라마, 숏폼 분야에서 주로 쓰일 가능성이 클 것으로 보인다. VFX 전문가들은 전봇대를 지우거나 휴대전화 화면을 바꾸거나 모니터 화면을 바꾸는 등 단순한 시각효과 작업을 두고 “생활 CG”라고 부르는데, 이 분야에 한한 AI 기술은 유용하고 저렴한 기술일 수 있다. A디자이너는 “일반 관객의 눈으로 봤을 때는 별로 문제가 없을뿐더러 최저가로 구현할 수 있기 때문에 숏폼이나 드라마 분야에 적합할 것”이라고 내다봤다. 참고로 시댄스 2.0을 선보인 바이트댄스는 숏폼 플랫폼인 틱톡을 소유한 기업이다. 비슷하게 조경훈 대표는 화제를 모은 격투 영상이 짧았고 무엇보다 ‘액션’이었음을 지적한다. “액션이니까 화제를 모았지 인간의 내밀한 감정을 전달해야 하는 신에서는 호응을 못 받을 것”이라고 말이다. 해당 영상을 보면 귀에 익은 브래드 피트와 톰 크루즈의 목소리로 표현된 대사가 들리지만, 길지 않은 대사로만 이뤄져 있다. 익숙한 배우들의 이미지와 음성을 바탕으로 한 영상이기에 시선을 끌지만 “관객이 실재하지 않는 존재에 환호하고 매력을 느끼는 데는 한계가 있을 것”이라고 조 대표는 내다봤다.
시댄스 2.0에 앞서 2025년 9월, AI 배우 틸리 노우드가 세상에 공개된 사건이 있었다. 미국배우조합이 노우드를 배우로 인정하지 않겠다는 입장을 내놓을 정도로 업계가 느끼는 불안감은 컸지만 노우드의 인기는 미미한 수준이다. 노우드의 인스타그램 팔로워 수도 9만명에 불과하다. 무엇보다 노우드는 실제 영화나 시리즈에 출연하거나 이용된 적이 없으며 인스타그램의 짧은 영상에 등장할 뿐이다. 노우드의 뒤에는 엘린 반 데르 벨덴이란 배우이자 작가인 실존 인물이 있었고, 노우드는 AI 기술을 이용하는 인간 예술가가 벌인 깜짝 이벤트였던 셈이다.
한편 톰 크루즈나 브래드 피트는 해당 영상에 대해 별다른 입장을 내놓지 않고 있다. 두 배우가 나서지 않더라도 할리우드는 이미 2023년 파업 당시 AI에 인간 배우가 무단으로 사용되지 않도록 일종의 안전선을 그어놓았기 때문이다. 미국작가조합과 미국배우조합 공동 파업 당시, 조합은 배우들의 추가 동의나 보수 없이는 3D 스캔을 통해 배우의 이미지를 복제하고 실제 배우를 대체할 수 없도록 배우를 보호하고 합성 출연자 사용 시 협상을 의무화하기로 할리우드 스튜디오들과 계약했다.
AI 기술이 날로 성장하고 있고 AI로 장편 상업영화를 만들 수 있을까. 물론 강윤성 감독의 <중간계>가 국내 첫 AI 장편영화로 꼽히나 1시간 분량에 불과하다. 또한 변요한, 김강우, 방효린 등 많은 배우들이 출연했으며 100%로 AI로 완성된 건 아니었다. 시간이 더 흐른 뒤 AI 영화라는 새로운 장이 열릴 수 있겠지만 시댄스 2.0이 그 시작점으로 영화사에 기록될 것 같지는 않다.