Google이 최신 AI 모델 Gemini 2.0 Flash를 통해 이미지 편집의 새로운 지평을 열었습니다. 기존엔 Imagen 3 등 별도 모델과 결합해야 했던 번거로움을 없앴는데요 Gemini 2.0 Flash는 하나의 모델에서 모든 걸 처리해, 속도와 효율성을 극대화했습니다.
Gemini 2.0 Flash 핵심 기능
✅ 놀라운 정밀도와 빠른 응답 속도
Gemini 2.0 Flash는 세부적인 부분만 정확히 수정하며, 나머지 이미지는 원본 그대로 유지합니다. 인물의 머리 스타일만 바꾸거나 크루아상 위에 초콜릿 소스만 추가하는 것도 자연스럽게 가능합니다.
쉽게 따라하는 Gemini 2.0 Flash 사용법:
- 모델을 Gemini 2.0 Flash Experimental로 설정하세요.
- 출력 형식을 'image and text'로 바꾸세요.
- 이미지를 업로드하고 원하는 편집 내용을 자연어로 입력하기만 하면 끝!
이미지 위에 텍스트를 자연스럽게 추가
기존 AI 모델은 전체 이미지를 새로 생성하여 원본이 변형될 위험이 있었습니다. 반면 Gemini 2.0 Flash는 원본을 최대한 유지하며 특정 부분만 정확히 변경합니다.
보시다시피 Gemini는AI가 이미지의 특정 부분만 수정합니다. 처음부터 완전히 새로운 이미지를 생성하지 않고 프롬프트에서 명시적으로 언급한 부분만 다시 그리는 것이니다.
Grok 3 및 기타 AI 모델과의 차이점
Grok 3 및 Gemini 2.0과 같은 이미지 생성기와 비교했을 때 Flash는 정밀도와 일관성 측면에서 분명한 이점이 있습니다. Grok 3를 사용하면 이미지를 생성한 다음 편집을 요청하면 AI가 원본을 정확하게 업데이트하는 대신 완전히 새로운 이미지를 만듭니다.
일반적으로 AI 이미지 생성 모델은 원본을 그대로 수정하기보다는 새로운 이미지를 생성하는 방식으로 동작합니다. 예를 들어, Grok 3에서는 다음과 같은 과정을 거치게 됩니다.
프롬프트
1: 갈색 테이블과 주변 조명 위에 놓인 호박색 액체가 담긴 둥근 향수병 프롬프트
2: "생성 AI" 텍스트 추가
결과적으로 생성된 이미지가 비슷해 보이긴 하지만, 원본과 비교하면 배경도 달라지고 향수병 모양도 달라졌습니다.
하지만 Gemini 2.0 Flash는 사용자가 원하는 특정 부분을 정확하게 수정하는 기능을 제공합니다.아래는 "Generative AI Publication"이라는 단어를 삽입한 결과입니다.
텍스트가 선명하고 자연스럽게 배치되었습니다. Midjourney, Flux 같은 경쟁 모델과 비교하면, Gemini는 뛰어난 텍스트 렌더링 기능을 갖추고 있습니다.
기존 제품 사진에 모델을 합성할 수도 있습니다.
X에 올라온 활용 사례 가운데, Kurawa Dono는 두 개의 이미지를 결합하여 제품과 모델을 자연스럽게 합성하는 데 성공했습니다. 이를 활용하면 광고 이미지 제작 비용을 절감하고, 포토샵 편집 없이도 고품질 제품 사진을 손쉽게 생성할 수 있습니다.
이걸 보고서 저도 합성해봤는데.. 저는 아주 자연스럽지는 않습니다.ㅎㅎㅎ
일관된 이미지로 동화 한 편, 뚝딱!
Google, 이제야 실력 발휘 제대로?
최근 OpenAI의 GPT-4.5, 중국의 ManusAI 등장으로 구글의 입지가 흔들리는 듯했지만, Gemini 2.0 Flash 출시로 다시 한번 최전선에 섰습니다.
이 기능을 활용하면, 디자이너뿐만 아니라 누구나 AI를 활용해 창의적인 작업을 할 수 있습니다!!!
Gemini 2.0 Flash Experimental을 사용해 보세요 :)
AI가 제공하는 새로운 가능성을 직접 경험할 수 있을 것입니다.
AI 레시피는 구독자님들의 창의적인 AI 여정을 응원합니다!
의견을 남겨주세요