ℹ️ 빠르게 발전중인 생성 AI 기술 중 그 주의 가장 주목할만한 모델만 큐레이션해서 보내드리는 뉴스레터에요. ✉️
ℹ️ 최신 논문과 연구 사례를 살펴보고 생성 AI 기술의 발전 동향을 미리 파악하고 대비할 수 있어요. 🧑💻
ℹ️ 어려운 기술 용어 지양하고 데모 영상 위주로 전달드려요. 데모 영상은 웹페이지에서 재생 가능해요. 📺
Genie
- Google은 사용자가 제어할 수 있는 작은 비디오 게임 세계를 만들 수 있는 Genie라는 새로운 AI를 만들었습니다.
- Genie는 특별한 지침 없이 수많은 동영상을 시청하는 것만으로 게임 세계를 만드는 방법을 배웁니다.
- 프롬프트, 그림 또는 간단한 드로잉으로 어떤 종류의 세상을 만들지 Genie에게 알려줄 수 있습니다.
Genie: Generative Interactive Environments
Gen4Gen
- 이제 인공지능은 몇 장의 예시 사진만 보고도 애완동물이나 좋아하는 장난감 등 자신의 물건이 그려진 그림을 그리는 법을 배울 수 있습니다.
- 이 모델은 AI가 자신의 물건이 많이 포함된 그림을 더 잘 그리도록 만드는 방법을 알아냅니다. 이전에는 AI가 모든 것을 맞추기 위해 혼란스러워했습니다.
- 연구진은 또한 AI가 얼마나 잘 그리는지, 즉 모든 것이 포함되었는지, 사용자가 쓴 설명과 일치하는지 점수를 매기는 방법을 고안해냈습니다.
데모 영상👇
Gen4Gen: Generative Data Pipeline for Generative Multi-Concept Composition
OpenCodeInterpreter
- OpenCodeIntepreter는 개발자가 더 나은 코드를 작성할 수 있도록 도와주는 새로운 모델입니다. 코드가 수행하고자 하는 작업을 이해한 다음 다양한 옵션을 생성하고 테스트하여 어떤 것이 가장 효과적인지 확인하는 방식으로 작동합니다.
- 이 도구는 사용자(개발자 및 기타)의 피드백을 사용하여 생성된 코드를 개선합니다. 시간이 지남에 따라 코딩을 더 잘할 수 있도록 학습하는 방법이라고 생각하면 됩니다.
- OpenCodeInterpreter는 값비싼 코딩 AI 성능에 필적합니다. 큰 비용을 들이지 않고도 강력한 코드 생성 지원을 받을 수 있습니다.
데모 영상👇
OpenCodeInterpreter: Integrating Code Generation with Execution and Refinement
MVDiffusion++
- 메타에서 발표한 MVDiffusion++는 카메라 각도를 모르더라도 몇 장의 사진만으로 물체의 상세한 3D 모델을 만들 수 있습니다.
- 다양한 상황에 맞게 조정할 수 있는 새로운 방식으로 작동하며 매우 높은 품질의 이미지를 생성할 수 있습니다.
- 이 모델은 기존의 다른 3D 모델링 방법보다 우수하며 텍스트 설명으로 3D 개체를 만드는 데에도 사용할 수 있습니다.
데모 영상👇
MVDiffusion++: A Dense High-resolution Multi-view Diffusion Model for Single or Sparse-view 3D Object Reconstruction
Language Model Predictive Control
- 로봇을 제어하는 코드를 작성하도록 초거대 언어 모델을 학습시킬 수 있습니다. 즉, 비전문가도 간단한 언어 명령을 통해 로봇을 제어할 수 있습니다.
- 현재 이러한 모델은 과거 요청에 대한 메모리가 제한되어 있습니다. 따라서 명령을 세분화하고 로봇에게 더 복잡한 작업을 가르치기가 더 어렵습니다.
- 해결책은 모델을 파인튜닝 하여 과거 명령을 더 잘 기억하고 사용자로부터 학습하는 속도를 개선하는 것입니다. 이렇게 하면 프로그래머 없이도 로봇에게 새로운 작업을 훨씬 쉽게 가르칠 수 있습니다.
데모 영상👇
Learning to Learn Faster from Human Feedback with Language Model Predictive Control
댓글
의견을 남겨주세요