메타, 차세대 동영상 생성 AI '무비 젠' 발표: 인스타그램에 통합 서비스 예정
본문 바로가기
AI Insight News

메타, 차세대 동영상 생성 AI '무비 젠' 발표: 인스타그램에 통합 서비스 예정

by AI.PixelMind 2024. 10. 6.
반응형

메타가 인공지능(AI) 시장에 새로운 혁신을 불어넣을 강력한 동영상 생성 AI 모델 '무비 젠(Movie Gen)'을 공개했습니다. 이 AI는 오픈AI의 동영상 생성 모델 '소라'에 맞서는 새로운 도전자로, 놀라운 기능들을 통해 동영상 생성과 편집의 미래를 새롭게 정의할 것으로 기대되고 있습니다.

↓↓↓↓↓

메타, 동영상 생성 AI ‘무비 젠’ 공개…오픈AI·구글과 경쟁 본격화

 

https://youtu.be/FHSSx4dUs7E

 

무비 젠: 메타의 혁신적 AI 비디오 생성 모델

메타는 지난 4일(현지 시간) 자사의 공식 웹사이트를 통해 '무비 젠'이라는 동영상 생성 AI 모델을 공개했습니다. 무비 젠은 텍스트 프롬프트를 기반으로 HD 비디오를 생성할 수 있는 모델로, 최대 16초 길이의 1080p 영상과 48kHz 오디오를 함께 생성합니다. 고화질 영상을 넘어 오디오 생성과 정밀한 비디오 편집까지 가능해 동영상 콘텐츠 제작에 있어 매우 강력한 도구로 자리매김할 전망입니다.

무비 젠은 300억 개의 매개변수를 갖춘 트랜스포머 모델로, 다양한 카메라 모션, 객체 상호 작용, 환경 물리학을 효과적으로 처리합니다. 이를 통해 비디오 생성의 디테일한 측면까지 높은 수준으로 구현해내며, 비디오 제작 과정에서 한층 더 몰입감을 느낄 수 있습니다.

 

(사진=메타) 출처 : AI타임스(https://www.aitimes.com)

강력한 비디오 편집 및 개인화 기능

무비 젠은 텍스트 프롬프트를 통해 비디오 내 특정 요소를 수정할 수 있는 고급 편집 기능을 갖추고 있습니다. 사용자는 객체나 색상 같은 부분적인 변경을 손쉽게 할 수 있을 뿐 아니라, 배경 교체 등과 같은 큰 변화를 텍스트만으로 지정할 수 있어 비디오 편집의 자유도가 크게 향상되었습니다.

특히 사용자가 자신의 이미지를 업로드하면 AI가 해당 이미지를 비디오에 등장시킬 수 있어, 개인화된 비디오 콘텐츠 제작도 손쉽게 가능합니다. 이는 개인뿐 아니라 브랜드나 인플루언서들이 자신만의 맞춤형 콘텐츠를 생성하는 데 유용하게 쓰일 수 있을 것입니다.

비디오와 오디오의 통합 생성

무비 젠은 비디오뿐만 아니라 130억 개의 매개변수를 갖춘 오디오 생성 모델도 통합하여, 시각적 콘텐츠와 완벽하게 일치하는 사운드를 생성할 수 있습니다. 이를 통해 사용자들은 영상 속 발자국 소리나 바람 소리 등 영화적인 음향 효과까지 더욱 손쉽게 구현할 수 있습니다. 이러한 '폴리(Foley) 사운드' 생성은 영상 제작에 있어 사운드의 퀄리티를 한층 높여주는 중요한 요소로 작용할 것입니다.

메타 플랫폼에서 통합 제공, 오픈 소스 공개는 없다

메타는 무비 젠을 내년부터 인스타그램, 왓츠앱, 메신저 등 자사 플랫폼에서 통합 서비스할 계획입니다. 메타 대변인은 "현재 내부 직원과 일부 영화 제작자 등 제한된 파트너들에게만 무비 젠을 제공하고 있다"고 밝히며, 오픈 소스로 공개될 가능성은 낮다고 덧붙였습니다.

이는 무비 젠이 메타의 하드웨어 및 플랫폼에서 전략적으로 활용될 것임을 암시합니다. 실제로 마크 저커버그 메타 CEO는 최근 열린 '커넥트' 행사에서 "AI가 스마트 안경과 같은 미래형 웨어러블에 더 큰 역할을 할 것"이라고 언급하며, 무비 젠이 이러한 비전의 중요한 부분이 될 것임을 시사했습니다.

 

인간 선호도 결과 (사진=메타) 출처 : AI타임스(https://www.aitimes.com)

기술적 기반과 해결 과제

무비 젠은 기존의 이미지 생성 모델에서 사용되던 확산 모델(Diffusion Model), 대형언어모델(LLM), 그리고 '플로우 매칭(Flow Matching)' 기술을 결합하여 개발되었습니다. 플로우 매칭은 비디오의 다음 장면을 예측할 때 자연스럽게 연결될 수 있도록 샘플 이동 속도를 계산해주는 기술로, 이를 통해 보다 현실적이고 자연스러운 동영상 콘텐츠를 생성할 수 있습니다.

다만, 아직 해결해야 할 문제도 있습니다. 현재 AI 모델로 비디오를 생성하는 데에 십 분 이상 소요되며, 이는 일반 소비자가 휴대폰에서 사용하기에는 시간이 오래 걸린다는 한계가 있습니다. 메타는 이러한 점을 개선하기 위해 연구를 계속하고 있으며, 특히 딥페이크나 폭력적인 영상 생성 문제를 방지하기 위한 안전과 책임성을 강화하는 작업에 중점을 두고 있습니다.

↓↓↓↓↓

메타, 새 비디오·오디오 생성AI 툴 '무비 젠' 공개...내년 자사 SNS에 통합

무비 젠, 영상 콘텐츠의 새로운 장을 열다

무비 젠은 기존의 동영상 생성 AI들과 비교했을 때 일관성, 동작의 자연스러움 등 다양한 속성에서 우수한 성능을 자랑하며, 인간 평가자들로부터 높은 평가를 받았습니다. 메타는 이를 위해 1억 개의 비디오와 10억 개의 이미지로 AI를 학습시켰으며, 이를 통해 물리적인 현실 세계를 이해하고 자연스러운 영상을 생성하는 능력을 향상시켰습니다.

메타는 무비 젠을 통해 개인 사용자뿐만 아니라 전문적인 영상 제작자, 심지어 할리우드 영화 제작자까지 폭넓은 사용자층이 이용할 수 있도록 하여, 영상 콘텐츠 생성의 새로운 가능성을 열어가고 있습니다. 이제 사용자는 텍스트만 입력하면 자신만의 독창적인 동영상과 오디오를 손쉽게 제작할 수 있게 되었습니다.

 

 

결론: 무비 젠의 미래 전망

메타의 무비 젠 출시는 동영상 생성 AI 기술의 진일보를 의미합니다. 향후 인스타그램 등 메타 플랫폼에 통합되어 사용자들에게 더 풍부한 창작 도구를 제공하게 될 무비 젠은 AI를 통해 영상 콘텐츠의 접근성을 크게 넓혀줄 것으로 기대됩니다. 이는 단순한 콘텐츠 생성 도구를 넘어, 창의성의 새로운 장을 여는 데 중요한 역할을 할 것입니다.

 

 

 

 

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

반응형