#175: 제미나이 2.5 플래시: 구글의 비밀 무기 'Nano Banana'가 공개되다

구독자 님, 안녕하세요?

AI 트렌드를 전달해드리는 Trendium.ai 입니다.

AI 커뮤니티에서 화제를 모았던 미스터리 모델의 베일이 드디어 벗겨졌습니다. LMArena 이미지 편집 리더보드를 석권했던 '나노 바나나(nano-banana)'가 사실은 구글이 비밀리에 개발한 최첨단 AI 기술이었음이 확인되었습니다.

by 💜Cutico @cuticogent

'나노 바나나(nano-banana)': 구글의 혁신적인 제미나이 2.5 플래시 이미지 공개

2025년 8월 26일(미국시간), 구글은 공식 발표를 통해 이 화제의 모델이 **제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image)**라고 밝히며, 즉시 제미나이 플랫폼을 통한 글로벌 서비스를 시작했습니다. 이로써 전문가들과 사용자들 사이에서 극찬받던 놀라운 이미지 편집 성능의 정체가 마침내 공개되었습니다.

이번 발표는 단순한 제품 출시를 넘어 AI 이미지 생성 및 편집 분야의 게임 체인저로 평가받고 있습니다. 특히 기존 AI 도구들의 약점이었던 이미지 일관성 문제를 혁신적으로 해결했다는 점에서, 창작자와 기업들의 워크플로우를 어떻게 변화시킬지, 그리고 치열한 AI 기술 경쟁에서 구글이 어떤 우위를 확보하게 될지 주목할 필요가 있습니다.

미스테리한 '나노 바나나'의 정체

#171: 미스터리한 혁신자, Nano Banana의 등장

제미나이 2.5 플래시 이미지의 등장은 매우 드라마틱했습니다. 최근 몇 주간 LMArena라는 크라우드소싱 AI 평가 플랫폼에서 '나노 바나나(nano-banana)'라는 익명의 모델이 이미지 편집 리더보드 상위권을 차지하며 주목받았습니다.

사용자들은 이 모델의 뛰어난 편집 능력에 찬사를 보냈지만, 정작 어떤 회사의 제품인지는 알 수 없었습니다. 구글 딥마인드의 CEO 데미스 하사비스(Demis Hassabis)는 SNS에 "현미경 아래서 이상한 물체가 발견됐다"라는 암시적인 게시물과 바나나 관련 힌트를 남기며 호기심을 자극했습니다.

결국 2025년 8월 25일(미국시간), 구글은 공식적으로 이 신비한 모델이 자사의 제미나이 2.5 플래시 이미지임을 발표했습니다. 현재 제미나이 앱의 모든 사용자가 이용할 수 있으며, 개발자들은 제미나이 API, 구글 AI 스튜디오, 버텍스 AI를 통해 접근 가능합니다.

제미나이 2.5 플래시 이미지 사용하기

접근 방법

제미나이 2.5 플래시 이미지는 여러 플랫폼에서 이용할 수 있습니다:

제미나이 앱: gemini.google.com에서 직접 사용
개발자용: Gemini API, Google AI Studio, Vertex AI
Adobe 통합: Adobe Firefly, Adobe Express에서도 사용 가능
Higgsfield : "나노 바나나"를 Pro 이상 구독자에게 무료로 무제한 제공합니다. Higgsfield에서 "HUGE Banana"라는 이름으로 체험판을 24시간 동안 무료로 열어두었습니다.

일반 사용자라면 제미나이 웹사이트(gemini.google.com)에 접속하는 것이 가장 간편합니다. 별도의 설치나 복잡한 설정 없이 바로 사용할 수 있습니다.

시작하기

(1) gemini.google.com

제미나이 웹사이트에 접속한 후, 채팅창 상단에서 **'Gemini 2.5 Flash'**를 선택하면 이미지 생성 및 편집 기능을 사용할 수 있습니다. 이 모델이 최신 이미지 처리 기능을 포함하고 있습니다.

(2) 저는 이미지를 입력하고 제품+패키지를 합성하는 내용으로 프롬프트를 입력했습니다.

prompt : Transform this image into a realistic photo of a full-body collectible figure with a colorful packaging box clearly visible and slightly blurred in the background, captured under soft studio lighting with natural shadows.

(3) 이미지 일관성이 정말 놀랍죠?

더 다양한 예시들은 아래 링크를 참조하세요.

https://ai.google.dev/gemini-api/docs/image-generation?hl=ko

힉스필드에서 나노바나나 사용하기

(1)https://higgsfield.ai/ 힉스필드에 접속후 NANO BANANA 버튼을 클릭합니다.

(2) 레퍼런스 이미지를 업로드한뒤 해당이미지를 어떻게 변화시키고싶은지 프롬프트를 작성하고 생성합니다.

역시 똑같이 피규어로 만들어보겠습니다.

(3) 이번에는 입력한 사진의 배경을 바꿔보겠습니다.

prompt: Using the provided image, change only the [specific element] to [new element/description]. Keep everything else in the image exactly the same,

preserving the original style, lighting, and composition.

기존의 인물은 두고 새로운 장소부분에 새로운 장소를 작성했더니 결과가 실제로 합성한것처럼 나왔습니다.

일관성 문제 해결의 핵심

구글 딥마인드의 시각 생성 모델 제품 리드인 니콜 브리히토바(Nicole Brichtova)는 이번 업그레이드의 핵심을 다음과 같이 설명했습니다: "자신이나 잘 아는 사람들의 사진을 편집할 때 미묘한 결함이 중요합니다. '비슷하지만 완전히 같지 않은' 묘사는 올바르지 않다고 느껴집니다".

기존 AI 이미지 편집 도구들의 가장 큰 문제점은 부분 편집 시 전체적인 일관성이 깨진다는 점이었습니다.

셔츠 색상만 바꾸려 했는데 얼굴 형태가 변형됨
배경을 교체하면 인물의 조명이나 그림자가 부자연스러워짐
여러 번의 연속 편집 후 원본과 완전히 다른 이미지가 됨

제미나이 2.5 플래시 이미지는 이런 문제들을 해결하기 위해 얼굴, 동물, 기타 세부 사항의 일관성을 편집 과정 전반에 걸쳐 보존하는 기술을 도입했습니다. 사용자가 다양한 의상이나 헤어스타일, 배경으로 인물을 변화시켜도 인식 가능한 모습을 유지할 수 있게 되었습니다.

강력한 편집 기능들

다중 이미지 합성

새로운 모델의 가장 인상적인 기능 중 하나는 여러 사진을 하나로 합성하는 능력입니다. 예를 들어, 별도로 촬영된 사람과 반려동물 사진을 농구 코트 배경과 합쳐 하나의 자연스러운 이미지를 만들 수 있습니다.

이는 단순한 합성을 넘어 각 요소 간의 조명, 그림자, 원근감까지 자연스럽게 조정하여 마치 실제로 함께 촬영한 것 같은 결과물을 생성합니다.

연속 편집 기능

기존 도구들과 달리 제미나이 2.5 플래시 이미지는 **다중 턴 편집(Multi-turn editing)**을 지원합니다. 이는 같은 이미지에 연속적인 수정을 적용할 수 있다는 의미입니다:

1단계: 벽면 색상 변경
2단계: 가구 추가
3단계: 조명 효과 조정

각 단계마다 처음부터 다시 시작할 필요가 없어 편집 효율성이 크게 향상되었습니다.

디자인 믹싱

특히 창의적인 분야에서 주목받는 기능은 디자인 믹싱입니다. 한 이미지의 시각적 요소를 다른 이미지의 객체에 적용할 수 있습니다.

구글이 제시한 예시:

나비 날개 패턴을 드레스 디자인에 적용
꽃잎 스타일을 신발 디자인에 반영

이런 기능은 패션 디자이너나 제품 디자이너들에게 새로운 영감과 효율적인 작업 도구를 제공할 것으로 기대됩니다.

실제 활용 사례와 가능성

비즈니스 활용

제미나이 2.5 플래시 이미지는 다양한 비즈니스 분야에서 활용 가능성을 보여줍니다:

마케팅: 제품 사진을 다양한 배경과 상황에 자연스럽게 배치
전자상거래: 동일한 제품의 다양한 스타일링 이미지 생성
부동산: 빈 공간에 가구를 배치한 가상 스테이징

크리에이티브 분야

Adobe와의 파트너십을 통해 Adobe Firefly와 Adobe Express에서도 제미나이 2.5 플래시 이미지를 사용할 수 있게 되었습니다.

소셜 크리에이터들은 일관된 룩앤필의 그래픽 시리즈 제작 가능
시각 디자이너들은 제품 콘셉트나 캐릭터 디자인의 빠른 프로토타이핑 가능
마케터들은 기존 캠페인 자산을 다양한 포맷으로 쉽게 변환 가능

구글의 제미나이 2.5 플래시 이미지는 AI 이미지 편집 분야에서 일관성이라는 핵심 과제를 해결함으로써 시장에 새로운 기준을 제시했습니다. 특히 다중 이미지 합성, 연속 편집, 디자인 믹싱 등의 고급 기능들은 기존 도구들과 명확한 차별점을 만들어냈습니다.

치열한 AI 이미지 시장 경쟁 속에서 구글이 기술적 우위를 확보할 수 있을지, 그리고 이것이 사용자 수 증가로 이어질지는 앞으로 지켜볼 일입니다. 분명한 것은 AI 이미지 편집 기술이 더욱 정교하고 실용적인 방향으로 발전하고 있다는 점입니다.

비즈니스부터 교육, 크리에이티브 작업까지 다양한 분야에서 활용 가능성을 보여주는 만큼, 관련 업계 종사자들에게는 새로운 기회가, 일반 사용자들에게는 더욱 편리한 이미지 편집 경험이 제공될 것으로 기대됩니다.

오늘의 Midjourney Prompt

by 💜Cutico @cuticogent

[prompt]a tight shot of a diverse group of 4 28 year olds hip and stylish lifestyle models in a somewhat dimly lit bar, mid-cheers all holding cocktails , but one person is holding a classic glass bottle coca cola. There are 2 girls and 2 guys in the group. The person holding the coca cola is clean-shaven Latino male model who looks like Xolo Maridueña with high cheekbones and a shaved head and a lean athletic build...he has a neutral non-smiling expression during the cheers. Render this to be high-resolution and photo realistic and to look like a candid shot by cinematographer Christopher Doyle q2 --ar 4:5 --style raw --v 7

구독자 님의 생각이 궁금해요!

뉴스레터 피드백 남기기 👍

자유로운 소통을 원하시는분은 오픈카톡방으로 오세요!

Trendium.ai 오픈카톡방 참여하기

Ai Image