구글, 살아있네! Gemini 2.0 Flash 일관된 이미지 쉽고 빠르게 생성

텍스트만로 원하는 이미지, 초간단 생성, 편집

2025.03.14 |

from.

기자 김연지

Google이 최신 AI 모델 Gemini 2.0 Flash를 통해 이미지 편집의 새로운 지평을 열었습니다. 기존엔 Imagen 3 등 별도 모델과 결합해야 했던 번거로움을 없앴는데요 Gemini 2.0 Flash는 하나의 모델에서 모든 걸 처리해, 속도와 효율성을 극대화했습니다.

Gemini 2.0 Flash 핵심 기능

✅ 놀라운 정밀도와 빠른 응답 속도

Gemini 2.0 Flash는 세부적인 부분만 정확히 수정하며, 나머지 이미지는 원본 그대로 유지합니다. 인물의 머리 스타일만 바꾸거나 크루아상 위에 초콜릿 소스만 추가하는 것도 자연스럽게 가능합니다.

쉽게 따라하는 Gemini 2.0 Flash 사용법:

모델을 Gemini 2.0 Flash Experimental로 설정하세요.
출력 형식을 'image and text'로 바꾸세요.
이미지를 업로드하고 원하는 편집 내용을 자연어로 입력하기만 하면 끝!

이미지 위에 텍스트를 자연스럽게 추가

기존 AI 모델은 전체 이미지를 새로 생성하여 원본이 변형될 위험이 있었습니다. 반면 Gemini 2.0 Flash는 원본을 최대한 유지하며 특정 부분만 정확히 변경합니다.

보시다시피 Gemini는AI가 이미지의 특정 부분만 수정합니다. 처음부터 완전히 새로운 이미지를 생성하지 않고 프롬프트에서 명시적으로 언급한 부분만 다시 그리는 것이니다.

Grok 3 및 기타 AI 모델과의 차이점

Grok 3 및 Gemini 2.0과 같은 이미지 생성기와 비교했을 때 Flash는 정밀도와 일관성 측면에서 분명한 이점이 있습니다. Grok 3를 사용하면 이미지를 생성한 다음 편집을 요청하면 AI가 원본을 정확하게 업데이트하는 대신 완전히 새로운 이미지를 만듭니다.

일반적으로 AI 이미지 생성 모델은 원본을 그대로 수정하기보다는 새로운 이미지를 생성하는 방식으로 동작합니다. 예를 들어, Grok 3에서는 다음과 같은 과정을 거치게 됩니다.

프롬프트

1: 갈색 테이블과 주변 조명 위에 놓인 호박색 액체가 담긴 둥근 향수병 프롬프트

2: "생성 AI" 텍스트 추가