2월 5주차 : 새로 공개된 신기한 생성 AI 모델 🧙‍♂️

지난주 공개된 놀라운 5가지 생성 AI 모델과 데모 영상을 확인해 보세요

2024.02.27 | 조회 379 |

ℹ️ 빠르게 발전중인 생성 AI 기술 중 그 주의 가장 주목할만한 모델만 큐레이션해서 보내드리는 뉴스레터에요. ✉️

ℹ️ 최신 논문과 연구 사례를 살펴보고 생성 AI 기술의 발전 동향을 미리 파악하고 대비할 수 있어요. 🧑‍💻

ℹ️ 어려운 기술 용어 지양하고 데모 영상 위주로 전달드려요. 데모 영상은 웹페이지에서 재생 가능해요. 📺

Genie: Generative Interactive Environments

이제 인공지능은 몇 장의 예시 사진만 보고도 애완동물이나 좋아하는 장난감 등 자신의 물건이 그려진 그림을 그리는 법을 배울 수 있습니다.
이 모델은 AI가 자신의 물건이 많이 포함된 그림을 더 잘 그리도록 만드는 방법을 알아냅니다. 이전에는 AI가 모든 것을 맞추기 위해 혼란스러워했습니다.
연구진은 또한 AI가 얼마나 잘 그리는지, 즉 모든 것이 포함되었는지, 사용자가 쓴 설명과 일치하는지 점수를 매기는 방법을 고안해냈습니다.

데모 영상👇

Gen4Gen: Generative Data Pipeline for Generative Multi-Concept Composition

OpenCodeIntepreter는 개발자가 더 나은 코드를 작성할 수 있도록 도와주는 새로운 모델입니다. 코드가 수행하고자 하는 작업을 이해한 다음 다양한 옵션을 생성하고 테스트하여 어떤 것이 가장 효과적인지 확인하는 방식으로 작동합니다.
이 도구는 사용자(개발자 및 기타)의 피드백을 사용하여 생성된 코드를 개선합니다. 시간이 지남에 따라 코딩을 더 잘할 수 있도록 학습하는 방법이라고 생각하면 됩니다.
OpenCodeInterpreter는 값비싼 코딩 AI 성능에 필적합니다. 큰 비용을 들이지 않고도 강력한 코드 생성 지원을 받을 수 있습니다.

데모 영상👇

OpenCodeInterpreter: Integrating Code Generation with Execution and Refinement

데모 영상👇

MVDiffusion++: A Dense High-resolution Multi-view Diffusion Model for Single or Sparse-view 3D Object Reconstruction

로봇을 제어하는 코드를 작성하도록 초거대 언어 모델을 학습시킬 수 있습니다. 즉, 비전문가도 간단한 언어 명령을 통해 로봇을 제어할 수 있습니다.
현재 이러한 모델은 과거 요청에 대한 메모리가 제한되어 있습니다. 따라서 명령을 세분화하고 로봇에게 더 복잡한 작업을 가르치기가 더 어렵습니다.
해결책은 모델을 파인튜닝 하여 과거 명령을 더 잘 기억하고 사용자로부터 학습하는 속도를 개선하는 것입니다. 이렇게 하면 프로그래머 없이도 로봇에게 새로운 작업을 훨씬 쉽게 가르칠 수 있습니다.

데모 영상👇

Learning to Learn Faster from Human Feedback with Language Model Predictive Control