ℹ️ 빠르게 발전중인 생성 AI 기술 중 그 주의 가장 주목할만한 모델만 큐레이션해서 보내드리는 뉴스레터에요. ✉️
ℹ️ 최신 논문과 연구 사례를 살펴보고 생성 AI 기술의 발전 동향을 미리 파악하고 대비할 수 있어요. 🧑💻
ℹ️ 어려운 기술 용어 지양하고 데모 영상 위주로 전달드려요. 데모 영상은 웹페이지에서 재생 가능해요. 📺
RT-Sketch
- AI 시스템은 다양한 방식(텍스트, 이미지 등)으로 목표를 제시하여 작업을 완료하도록 학습시킬 수 있습니다.
- RT-Sketch는 손으로 그린 스케치는 간단하게 만들 수 있으면서도 AI에 상세한 시각적 지침을 제공한다는 점에서 독특한 솔루션을 제공합니다.
- 스케치를 지침으로 사용하면 AI 시스템이 환경의 중요 사항을 더 잘 이해하고 중요하지 않은 세부 사항은 무시할 수 있습니다.
데모 영상👇
RT-Sketch: Goal-Conditioned Imitation Learning from Hand-Drawn Sketches
PeRFlow
- PeRFlow를 사용하면 이미지 생성 속도가 빨라집니다. Stable Diffusion과 같은 도구와 함께 사용하면 더 적은 단계로 이미지를 생성하거나 편집할 수 있습니다.
- PeRFlow는 적응력이 뛰어납니다. 특정 스타일에 맞게 사용자 정의된 다양한 버전의 Stable Diffusion과 함께 사용할 수 있습니다.
- PeRFlow는 플러그 앤 플레이 방식으로 설계되었습니다. 기존 이미지 제작 워크플로우를 크게 변경하지 않고도 쉽게 추가할 수 있는 애드온입니다.
데모 영상👇
PeRFlow: Piecewise Rectified Flow as Universal Plug-and-Play Accelerator
ProciGen
- AI가 일반 사진에서 사람이 3D로 물체와 상호작용하는 방식을 이해하도록 하는 것은 어렵습니다. 현재 시스템은 학습되지 않은 사물에 대해서는 잘 작동하지 않습니다.
- ProciGen은 사람이 사물과 상호작용하는 컴퓨터 생성 이미지의 방대한 데이터 세트를 생성합니다. 이를 통해 AI(HDM이라고 함)가 이전에 본 적이 없는 물체와의 상호작용을 더 잘 이해하도록 훈련시킵니다.
- 이제 AI는 이전에 해당 물체를 본 적이 없더라도 3D 공간에서 사람이 물체와 어떻게 상호 작용하는지 파악할 수 있습니다.
데모 영상👇
ProciGen: TEMPLATE FREE RECONSTRUCTION OF HUMAN-OBJECT INTERACTION WITH PROCEDURAL INTERACTION GENERATION
VideoElevator
- T2I(텍스트-이미지 변환) 모델은 T2V(텍스트-비디오 변환) 모델보다 멋지고 디테일한 이미지를 만드는 데 더 효과적입니다.
- VideoElevator는 T2I의 기능을 사용하여 T2V로 생성된 동영상의 문제를 해결하는 새로운 도구입니다.
- VideoElevator는 동영상을 더 부드럽고 선명하게 만들며, 특별한 예술적 스타일을 추가할 수도 있습니다.
데모 영상👇
VideoElevator: Elevating Video Generation Quality with Versatile Text-to-Image Diffusion Models
CRM
- CRM은 재현하려는 3D 형상을 이해하도록 설계되어 더욱 정확하고 세밀한 모델을 만들 수 있습니다.
- CRM은 단일 이미지에서 고품질 3D 모델을 빠르게 생성할 수 있어 이전 방식보다 훨씬 빠릅니다.
- 제품 및 경험 구축에 직접적으로 유용한 텍스처 메시를 만드는 데 중점을 둡니다.
데모 영상👇
CRM: Single Image to 3D Textured Mesh with Convolutional Reconstruction Model
댓글
의견을 남겨주세요