OpenAI에서 text-to-video 모델 Sora를 공개했습니다. text-to-video란 입력한 텍스트 명령어를 입력하면 동영상이 생성되는 것을 의미합니다.
text-to-image 즉 글로 그림을 시대에서 올해는 글로 동영상을 만드는 시대로 넘어가는 이 시점에서, 기술의 새로운 지평을 목격하고 있습니다.
OpenAI가 공개한 text-to-video 모델 Sora는 단순한 텍스트 명령어를 입력함으로써 해당되는 영상을 생성하는 AI 기술입니다. 이 기술은 기존의 주요 경쟁자들이 한 번에 최대 4초 길이의 영상을 만드는 데 그쳤던 것과 비교해, 최대 1분 길이의 영상을 생성할 수 있는 능력으로 이 분야에서의 게임 체인저가 되었습니다.
Sora의 영상은 놀라울 정도로 훌륭합니다. OpenAI의 홈페이지에서 Sora가 생성한 영상을 볼 수 있습니다. Sora는 다양한 캐릭터, 특정 동작 유형, 그리고 피사체와 배경의 정확한 디테일을 포함한 복잡한 장면을 생성할 수 있습니다.
이제, OpenAI가 공개한 몇 가지 영상을 통해 Sora의 놀라운 능력을 확인해 보겠습니다.
과거에 영화 감독이 되는 것은 극히 일부의 전문가만의 특권이었습니다. 막대한 자본, 전문적인 기술, 그리고 수많은 인력이 필요했습니다. 하지만 유튜브의 등장은 영화 제작의 민주화를 가져왔습니다. 유튜브 세상에서는 만든이가 영화 감독이든, 일반인이든 구분하지 않습니다. 누구나 쉽게 영상을 만들고 배포할 수 있었습니다.
그럼에도 불구하고 영상을 만든다는 건 쉬운 일이 아닙니다. 영상 관련 툴을 배우고 익힌 인력들이 할 수 있고 그걸 못하면 전문가의 도움을 빌어야 했습니다. 그러나 Sora의 등장으로 유치원생도 영화 감독이 될 수 있는 세상을 열었습니다. 상상력만 있으면 누구나 자신의 이야기를 시각적으로 표현하고, 그것을 전 세계와 공유할 수 있는 시대가 되었습니다.
문제는 이제 상상력입니다. 상상력의 경쟁이 시작된 것입니다.
Sora는 아직 OpenAI 내부에서 테스트 중인 모델로 일반 사용자에게는 아직 배포되지 않았지만, Sora를 활용해 만든 영상과 이 영상을 만들기 위해 활용된 프롬프트는 보실 수 있습니다. 더 많은 영상을 보길 원하신다면 OpenAI Sora 페이지를 방문해 보시기 바랍니다.