구독자 님, 안녕하세요?
AI 트렌드를 전달해드리는 Trendium.ai 입니다.
텍스트 한 줄로 게임·애니메이션급 3D 캐릭터 모션을 생성하는 텐센트의 HY-Motion 1.0,이제 메타버스가 코앞이다 라는 말이 과장이 아닌 시대가 되었습니다.
by 💜Cutico @cuticogent
텐센트는 Diffusion Transformer(DiT) 아키텍처와 플로 매칭(flow matching)을 기반으로 한 10억 파라미터 규모의 이 모델을 오픈소스로 공개하며, 3D 캐릭터 애니메이션 생성 분야에 새로운 지평을 열었습니다. 자연어 텍스트 한 줄로 고품질의 유려하고 다양한 3D 모션을 생성할 수 있는 이 모델은 개발자와 크리에이터에게 강력한 도구가 될 것입니다. 생성된 애니메이션 에셋은 기존 3D 제작 파이프라인에 쉽게 통합할 수 있어, 게임, VFX, 애니메이션 등 다양한 분야에서 즉시 활용 가능합니다. 이제 자세한 내용을 살펴보겠습니다.

하이라이트
HY-Motion 1.0은 텍스트 입력만으로 "걷기"부터 "검을 휘두르며 달리기" 같은 복합 동작까지 생성하는 차세대 모델입니다. 이 모델의 주요 강점은 다음과 같습니다:
- 10억 규모 DiT: 플로 매칭 기반의 DiT를 10억 개 이상의 파라미터로 스케일링하여, 지시문 이해 성능과 모션 품질에서 새로운 기준을 제시합니다. 이로 인해 프레임 간 부드러운 연결과 정교한 컨트롤이 가능해지며, 기존 모델보다 훨씬 세밀한 표현을 제공합니다.
- 풀 스테이지 학습 전략: 업계 최초로 프리트레이닝(Pre-training), SFT(Supervised Fine-Tuning, 지도 미세 조정), 그리고 RL(강화학습) 루프를 모두 적용한 모델입니다. 이 전략은 물리적 자연스러움(예: 발 미끄러짐 방지, 관절 꺾임 최소화)과 의미적 정확도를 동시에 최적화하여, 생성된 모션이 현실적이고 어색함 없이 완성되도록 합니다.
- 포괄적인 카테고리 커버리지: 세심하게 설계된 데이터 파이프라인을 통해 6개 대분류에 걸쳐 200개 이상의 동작 카테고리를 지원합니다. 이는 업계에서 가장 넓은 범위를 자랑하며, 걷기, 달리기, 점프, 회피, 전투 동작(검, 창, 활 등), 감정 표현, 일상 행동 등을 포함합니다. 복합 명령어처럼 "뒤로 물러나며 창을 막기" 같은 세부 지시도 자연스럽게 처리합니다.
이러한 하이라이트는 HY-Motion 1.0이 단순한 연구 모델이 아닌, 실무에서 바로 써볼 수 있는 수준의 도구임을 증명합니다.
기술적 특징

HY-Motion 1.0의 핵심은 Diffusion Transformer(DiT)와 Flow Matching의 결합입니다. 디퓨전 모델의 고품질 생성 능력과 트랜스포머의 시퀀스 이해 능력을 융합하여, 프레임 간 부드러운 연결과 정교한 모션 컨트롤을 실현합니다. 이 구조는 10억 파라미터급 대형 모델로 구현되어, 다양한 체형, 속도, 리듬의 동작을 표현할 수 있습니다. 기존 연구용 3D 모션 모델보다 훨씬 큰 스케일로, 복잡한 시나리오에서도 안정적인 결과를 제공합니다.
특히 주목할 점은 RLHF(Reinforcement Learning from Human Feedback)의 적용입니다. 사전 학습과 SFT를 넘어 강화학습까지 도입한 첫 모션 모델로, 인간 피드백을 기반으로 어색한 자세(예: 무게중심 붕뜸, 관절 이상)를 보정합니다. 이는 텍스트 조건을 만족하면서도 물리적으로 그럴듯한 모션을 생성하는 데 초점을 맞춰, 업계 최초 수준의 적용 사례를 제시합니다. 예를 들어, "검을 휘두르며 걷기" 같은 명령에서 모션이 자연스럽고 현실적으로 구현됩니다.
커버리지와 활용 시나리오
HY-Motion 1.0은 200개 이상의 동작 카테고리를 지원하며, 이는 걷기·달리기·점프·회피·전투 동작부터 감정 표현과 일상 행동까지 포괄합니다. 복합 명령어도 문제없이 처리하여, 크리에이터의 창의성을 극대화합니다.
활용 시나리오는 다음과 같습니다:
- 게임 개발: NPC, 몬스터, 플레이어의 공용 모션 라이브러리를 자동 생성하여 개발 속도를 높입니다. 예를 들어, "활을 쏘며 도망치기" 같은 동작을 텍스트로 즉시 만들어냅니다.
- 애니메이션 제작: 러프 모션 블록아웃이나 프리비즈(Previs)를 자동화하여 초기 단계의 작업 부담을 줄입니다. 복잡한 장면에서도 고품질 모션을 빠르게 생성할 수 있습니다.
- 메타버스/VTuber: 실시간 제스처나 액션용 모션 클립을 생성하여 가상 캐릭터의 생동감을 더합니다. VTuber 스트리밍에서 텍스트 기반으로 즉흥적인 모션을 적용할 수 있습니다.
이 모델은 표준 BVH/FBX 형식으로 내보내기 가능하여 Unity, Unreal Engine, DCC 툴과 쉽게 연동됩니다.
오픈소스 공개와 개발 친화성
텐센트는 HY-Motion 1.0을 완전 오픈소스로 공개했습니다. Hugging Face와 GitHub에서 모델 가중치, 샘플 스크립트, 학습·추론 코드를 모두 다운로드할 수 있으며, PyTorch 기반 파이프라인으로 로컬이나 클라우드 환경에서 바로 테스트 가능합니다.
* 링크
- Project Page: https://hunyuan.tencent.com/motion
- GitHub: https://github.com/Tencent-Hunyuan/HY-Motion-1.0
- Hugging Face: https://huggingface.co/tencent/HY-Motion-1.0
- Technical report: https://arxiv.org/pdf/2512.23464
이 공개는 연구자와 상용 개발자 모두에게 열려 있으며, 커스텀 캐릭터 리타게팅, 장르별 LoRA 스타일 모션, 스튜디오 내 RLHF 재학습 등 확장 가능성이 큽니다. 인디 크리에이터부터 대형 스튜디오까지 누구나 활용할 수 있는 생태계를 조성합니다.
텍스트로 연출하고, AI가 모션을 완성하는 시대가 왔습니다. HY-Motion 1.0은 3D 애니메이터의 손을 대체하는 것이 아니라, ‘블록킹·라이브러리 생성’을 맡아주는 든든한 동료에 가깝습니다. 게임·애니 스튜디오, 그리고 인디 크리에이터까지—지금 바로 GitHub와 Hugging Face에서 HY-Motion 1.0을 내려받고, 당신의 파이프라인에 AI 모션을 실험해보세요.
다음 뉴스레터에서 더 흥미로운 AI 업데이트를 기대해주세요!
문의나 피드백은 카카오톡 오픈채팅방에서 만나요 ~!
오늘의 Nano-Banana Prompt
by 💜Cutico @cuticogent

[prompt]A metaverse architect (Subject) sitting in a dark futuristic command room filled with floating holographic city grids and 3D worlds (Environment), controlling entire virtual universes with both hands like a conductor (Action), seen from a slightly low angle medium shot (Composition), ultra-detailed 3D render in neon cyan and magenta color scheme with volumetric lighting and particle effects (Style).
[자동 프롬프트]
메타버스 아키텍트, 다크 한 미래적 명령실, 떠다니는 홀로그램 도시 그리드와 3D 세계, 가상 우주를 양 손으로 제어하는 지휘자, 약간 낮은 각도 중간 샷, 네온 사이안과 마젠타 색상, 볼륨 조명 및 입자 효과
An ultra-detailed 3D render featuring a metaverse architect sitting in a dark futuristic command room. The environment is filled with floating holographic city grids and 3D worlds, depicted in a neon cyan and magenta color scheme. The architect is conducting entire virtual universes with both hands, adding a sense of dynamic control and power. The image is seen from a slightly low angle medium shot, highlighting the majesty and scale of the scene. Volumetric lighting and particle effects enhance the atmosphere, casting a surreal and immersive glow around the architect.
의견을 남겨주세요