中 바이트댄스 개발 AI 돌풍

목소리 구현 무단학습 의혹도

동영상 플랫폼 틱톡 모기업인 중국 바이트댄스가 인공지능(AI) 영상 생성 모델 ‘시댄스(Seedance) 2.0’을 출시하고 AI 영상 경쟁에 출사표를 냈다. 사진 한 장이나 간단한 프롬프트(명령어)만으로 오픈AI ‘소라’ 등 기존 영상 생성 모델 이상의 자연스러운 영상 제작이 가능한 것으로 평가되지만, 바이트댄스가 이용자 데이터를 무단으로 학습한 것 아니냐는 의혹도 제기된다.

11일 중국 관영 글로벌타임스 등에 따르면 바이트댄스는 시댄스 2.0을 제한적 테스트 모드로 지난 7일 출시했다. 매체들은 출시된 지 불과 며칠 만에 시댄스 2.0을 활용해 제작한 콘텐츠가 사회관계망서비스(SNS)에서 큰 화제가 되고 있다고 전했다.

AFP통신은 스위스에 본사를 둔 컨설팅업체 ‘CTOL 디지털 솔루션즈’의 분석을 인용해 “시댄스 2.0은 현재 이용 가능한 가장 진보한 AI 영상 생성 모델”이라며 “시각적인 품질을 높이는 수준을 넘어 기존에 숙련된 전문가들만이 할 수 있던 편집 영역까지 자동화시켰다는 점에서 영상 생성 역량의 근본적인 전환을 의미한다”고 평가했다.

중국은 관영매체를 통해 시댄스 2.0의 반향 소식을 주요하게 전하며 미국·중국 간 AI 기술 격차가 현저하게 줄어들고 있다는 점을 띄우고 나섰다. 글로벌타임스는 “중국과 서방의 AI 영상 모델 간 격차는 민망할 정도이며, 미국에서 공개된 어떤 것보다 두 세대는 앞서 보인다”는 등의 중국 네티즌 반응을 소개했다.

다만 이 같은 놀라운 성능 이면에는 바이트댄스가 데이터를 무단으로 학습했다는 의심을 받는다. 중국 테크 유튜브 채널 ‘미디어스톰’을 운영하는 인플루언서 팀(Tim)은 최근 시댄스 2.0 리뷰 영상을 통해 음성 정보가 제공되지 않은 상태에서 얼굴을 업로드한 것만으로도 본인의 실제 목소리와 같은 음성으로 말하는 영상이 만들어졌다고 주장했다. 그는 시댄스2.0의 성능을 극찬하면서도 이에 대해 “매우 무서웠다”고 말했다.

바이트댄스가 전 세계에서 20억명에 육박하는 이용자를 보유한 틱톡의 모기업인 만큼 데이터 무단 학습 의혹으로부터 자유롭기 어렵다는 지적도 있다. 시댄스 2.0 운영팀은 건강하고 지속 가능한 창작 환경을 보장하기 위해 실제 인물의 이미지나 영상을 참조하는 것을 중단한다고 지난 9일 중국 현지매체 상하이증권보에 밝혔다.