구독자 님, 안녕하세요?
AI 트렌드를 전달해드리는 Trendium.ai 입니다.
Hunyuan3D에서 1.0 버전의 Hunyuan3D World Model을 오픈소스로 출시했습니다.
이 모델은 단어 하나 또는 이미지 하나만으로 몰입감 있고 탐험 가능한 3D 세계를 생성할 수 있습니다.
by 💜Cutico @cuticogent
영상을 넘어 3D로: 훈위안의 새로운 도약
훈위안 모델은 13억 개의 매개변수를 기반으로 3D VAE와 Transformer 기반의 확산(Diffusion) 구조를 채택하고 있으며, 고해상도 및 고프레임 영상을 안정적으로 생성할 수 있는 기술력을 보유하고 있습니다. 최대 16초의 긴 클립을 생성할 수 있는 점도 차별화된 강점으로 평가받고 있습니다. 이 모델은 다중 인물의 감정 표현이나 단일 이미지 기반의 연속적 애니메이션 생성에 적합하며, 자연스럽고 고품질의 표현력을 바탕으로 프로토타입이나 단순 콘텐츠 제작 환경에 효율적으로 적용되고 있습니다.
다만 최근에는 Google의 Veo, Kuaishou의 Kling, Runway 등 고성능 영상 생성 도구들이 잇따라 공개되면서 훈위안의 기술적 위상이 다소 후퇴하는 분위기도 감지되고 있습니다. 이러한 상황 속에서 텐센트는 새로운 방향성을 제시하며 다시 주목을 받고 있습니다. 바로 몰입형 3D 월드 생성 기술을 세계 최초로 오픈소스 형태로 공개하였기 때문입니다.
해당 시스템은 텍스트 또는 이미지를 입력으로 받아 360도 몰입형 시각 환경을 자동 생성할 수 있는 기능을 갖추고 있습니다. 단 한 번의 클릭만으로 파노라마 시야가 구성되며, 강력한 의미 이해 능력과 공간 추론 기술을 통해 끊김 없는 시각적 경험을 제공하고 있습니다. 특히 VR 환경에 최적화된 결과물을 구현할 수 있어, 몰입형 콘텐츠 제작에 매우 적합합니다.
또한 훈위안의 3D 장면 생성 시스템은 레이어 기반의 공간 표현 방식을 채택하고 있으며, 자유롭게 탐색 가능한 3D 월드를 구성할 수 있도록 지원하고 있습니다. 생성된 장면은 표준 3D 메시 애셋(Mesh Asset) 형식으로 내보내기가 가능하여, Unity, Unreal Engine 등 상용 게임 엔진 및 모델링 소프트웨어와의 호환성도 확보하고 있습니다. 이를 통해 개념 디자인과 실제 제작 파이프라인 간의 연결을 원활하게 하고 있으며, 상호작용성과 시뮬레이션 활용성 측면에서도 뛰어난 유연성을 보여주고 있습니다.
이번 발표는 텐센트가 멀티모달 생성 AI 경쟁 구도 속에서 다시 한 번 기술적 우위를 확보하려는 전략의 일환으로 해석되고 있습니다. 영상 생성이라는 기존의 프레임을 넘어, 몰입형 3D 시뮬레이션이라는 새로운 영역을 선도하고 있다는 점에서 의미가 크다고 할 수 있습니다.
시작하기
(1) 먼저 hunyuan3D (https://3d.hunyuan.tencent.com/sceneTo3D) 사이트에 접속하여 로그인 합니다.
위쳇이나 QQ메신저 인증을 하지않아도 이메일로 인증번호를 받아 로그인할수있습니다.
(2) 로그인후 상단 메뉴에서 [3D世界模型] 메뉴를 클릭합니다.
(3) 상단 메뉴에서 [360° 파노라마 생성] 또는 [3D 로밍 장면 생성]을 선택할 수 있습니다.
360° 파노라마 생성
이 시스템은 한 번의 클릭으로 360도 몰입형 시각 환경을 생성할 수 있도록 합니다. 텍스트와 이미지를 모두 입력으로 받아들이며, 강력한 의미 이해 능력과 지능적인 공간 추론을 통해 끊김 없는 360도 파노라마 시야를 추론하여 VR에 최적화된 몰입형 경험을 구축합니다.
3D 로밍 장면 생성
레이어별 3D 장면 표현을 특징으로 하는 이 프레임워크는 공간적으로 일관되고 자유롭게 마우스와 방향키를 통해 탐색 가능한 3D 월드 생성을 지원합니다. 표준 3D 메시 애셋 내보내기를 지원하여 주류 게임 엔진 및 모델링 소프트웨어와의 호환성을 보장하여 컨셉 디자인과 프로덕션 파이프라인 간의 격차를 해소합니다.
(4) 한옥 마을 이미지를 미드저니로 생성하여 직접 360도 파노라마 장면을 생성해보았습니다.
생성은 30초 이내로 생성되고 실제 이미지가 잘 반영되어서 생성되지만 업스케일이 필요할것으로 보입니다.
https://3d.hunyuan.tencent.com/share?shareId=aa9c7ec8-6be2-45d1-acf6-3f4875a0b2e8&shareType=panorama
훈위안 월드 생성 모델의 기대효과
훈위안의 3D 월드 생성 모델은 여러 산업 분야에 혁신적인 변화를 가져올 것으로 기대됩니다. 특히 다음과 같은 영역에서 중요한 역할을 할 전망입니다:
- 게임 개발 혁신: 게임 디자이너들은 복잡한 3D 모델링 과정 없이도 신속하게 프로토타입을 제작할 수 있어, 창의적인 아이디어를 빠르게 시각화하고 테스트할 수 있습니다.
- VR/AR 콘텐츠 제작 가속화: 몰입형 가상현실 및 증강현실 경험을 더 쉽고 빠르게 구축할 수 있어, 관련 산업의 성장을 촉진할 것입니다.
- 건축 및 도시 계획: 도시 계획자와 건축가들이 프로젝트를 시각화하고 다양한 디자인 옵션을 탐색하는 데 활용할 수 있습니다.
- 교육 및 훈련: 시뮬레이션 기반 학습 환경을 쉽게 구축할 수 있어, 다양한 교육 및 훈련 프로그램에 적용될 수 있습니다.
이러한 기대효과는 기술의 접근성이 높아짐에 따라 더욱 확대될 전망입니다. 오픈소스로 제공됨으로써 개발자와 창작자들이 더 쉽게 이 기술을 활용할 수 있게 되었고, 이는 새로운 창의적 응용 분야의 출현으로 이어질 것입니다.
훈위안의 월드 생성 모델은 단순한 기술 혁신을 넘어 디지털 콘텐츠 제작의 패러다임을 바꿀 잠재력을 가지고 있습니다. 특히 진입 장벽을 낮추고 제작 시간을 단축함으로써, 소규모 스튜디오나 개인 창작자들에게도 고품질 3D 콘텐츠 제작의 기회를 제공할 것입니다. 이처럼 AI 툴들은 텍스트에서 이미지, 영상, 3D 월드, 실시간 가상현실까지 영역을 점점 더 넓혀가고 있습니다.
생성형 AI 영상이 얼마나 빠르게, 더 사실적으로 발전했는지 우리는 지켜봐 왔기에 잘 알고 있습니다. 이제는 어떤 가상현실에서 무엇을 만들고 즐길지에 대한 문화적, 경제적 논의가 필요한 시점입니다. 어떤 미래를 꿈꾸는지 논의하고 싶다면 뉴스레터 아래에 있는 트렌디움 오픈채팅방에 참여해 보세요.
다양한 미래에 대한 상상력을 공유해요! 다음 편에서 만나요
오늘의 Midjourney Prompt
by 💜Cutico @cuticogent
[prompt]a scenic alley in Bukchon Hanok Village, Seoul, traditional Korean hanok houses on both sides, wide clear blue sky taking up more than half the frame, almost no clouds, crisp and clean midday atmosphere, soft daylight from upper left (5200K), subtle shadows to bottom right, peaceful and bright mood, realistic photographic style, no people, vertical 3:4 aspect ratio, designed for portrait compositing
의견을 남겨주세요