AI 영상 인물 일관성 잡는 키 비주얼 제작법

인물 일관성을 지키는 키비주얼 생성기

2026.06.08 |
from.
사다리필름

📬 사다리 AI 레터 20호

안녕하세요, 사다리필름입니다.

하반기 채용 영상, 교육 콘텐츠 기획을 슬슬 시작하시는 분들이 많아지는 시기입니다. AI 영상 제작에 도전해보셨거나, 막 시작하려는 분들께 요즘 저희한테 가장 많이 들어오는 질문 하나를 꺼내서 이번 호를 준비했습니다.

오늘 레터에서는

✅ AI 영상 속 인물이 장면마다 달라지는 문제, 구조적으로 해결하는 방법

✅ 사람뿐만 아니라 캐릭터에도 똑같이 적용했더니 — 내부 실험 결과 공개

이렇게 2가지를 나눠드립니다.


담당자 여러분의 업무가 조금이라도 더 수월해지길 바라며, 인사를 마칩니다. 💌


1. 기획자를 위한 AI 레시피 🔦

"장면마다 사람이 바뀐다면 — AI 인물 일관성 지키는 법

첨부 이미지

어느 목요일 오후, 이런 상황이 생겼습니다.

AI로 교육 영상 초안을 뽑았습니다. 1장면: 30대 여성 강사. 단발머리. 네이비 재킷. 3장면: 머리 색이 바뀌어 있습니다. 5장면: 얼굴형이 달라졌습니다. 7장면: 아예 다른 사람이 나옵니다.

품의서에 올리기 전에 멈추게 되는 순간입니다. "이 사람이 같은 사람 맞나요?"

이런 경험, 한 번쯤 있으시죠?

왜 이런 일이 생기는 걸까요.

첨부 이미지

원인은 두 가지입니다.

첫째, AI는 매 장면을 독립적으로 생성합니다. 기준 이미지가 없으면, 프롬프트가 같아도 결과가 달라집니다.

둘째, 그리고 이게 더 중요합니다. 정면 이미지 하나만 있으면, AI는 옆모습과 뒷모습을 스스로 "상상"해서 만듭니다. 그 상상이 원본과 전혀 다른 사람을 만들어냅니다.

인물의 여러 각도를 미리 확정해두지 않으면, 일관성은 운에 맡기는 것과 같습니다.

해결은 두 단계로 이루어집니다.


STEP 1. 인물 페르소나를 먼저 언어로 설계하라

첨부 이미지

"30대 여성 강사"라고 프롬프트를 넣으면, AI가 나머지를 채웁니다. 그 채움이 장면마다 달라지는 원인입니다.

해결은 간단합니다. 이 인물이 누구인지, 먼저 텍스트로 확정해두는 것입니다. AI가 상상으로 채울 여지 자체를 없애는 것이 핵심입니다.

이름: 김지은

나이: 34세

직업: 기업 HRD 담당자

체형: 보통 키, 단정한 체형

헤어: 어깨선 단발, 자연스러운 웨이브, 짙은 갈색

얼굴형: 계란형, 이마 약간 넓음

표정 기본값: 신뢰감 있는 미소, 눈매 부드러움

스타일: 네이비 재킷, 화이트 이너, 금속 테 안경

피부톤: 밝은 중간 톤

특이사항: 오른손잡이, 서 있을 때 약간 오른쪽으로 무게중심

이 페르소나를 바탕으로 이미지 프롬프트를 뽑으면, 매번 "느낌이 비슷한 결과"가 아니라 "같은 인물"에 수렴하는 결과가 나옵니다.

막연할수록 AI의 상상이 커집니다. 구체적일수록 AI의 상상이 줄어듭니다.

STEP 2. 흰 배경 키 비주얼 4컷을 먼저 확정하라

첨부 이미지

[이미지 자리 1: 키 비주얼 4컷 구성 예시 — 정면/측면/후면/클로즈업]

페르소나가 완성됐다면, 영상 제작에 들어가기 전 아래 4컷을 흰 배경으로 먼저 뽑아서 레퍼런스 이미지로 고정합니다. 최소 4컷 이미지이고, 더 디테일하고 역동적인 무브를 주어야 하는 캐릭터의 경우 더 다양한 각도에서의 키 이미지를 뽑기도 합니다.

✅ 정면 전신 (흰 배경) — 기본 레퍼런스

✅ 측면 상반신 (흰 배경) — 옆 장면 AI 상상 방지

✅ 후면 전신 (흰 배경) — 뒷모습 AI 상상 방지

✅ 클로즈업 정면 (흰 배경) — 표정·이목구비 디테일 고정

측면과 후면을 따로 뽑는 이유가 있습니다. AI는 정면 이미지만 보고 나머지 각도를 추론해 만들어냅니다. 그 추론 과정에서 귀 모양, 뒷머리 볼륨, 어깨 라인이 달라집니다. 미리 확정해두면 AI가 재해석할 여지가 없습니다.

첨부 이미지

배경을 흰색으로 뽑는 이유는 하나입니다. 이후 어떤 배경에도 잡음 없이 합성할 수 있기 때문입니다.

이 4컷이 확정된 뒤, 이후 모든 장면 생성 시 이 이미지를 레퍼런스로 입력합니다. AI가 인물을 재해석할 여지가 없어집니다.

저희 사다리필름은 Google Flow에서 나노바나나(Nanobana) 엔진을 선택해 작업합니다.

텍스트 페르소나를 프롬프트로 변환한 뒤, 나노바나나 엔진에서 4컷을 순차 생성합니다. 레퍼런스 이미지로 고정하고 나면, 장면 간 인물 일관성이 눈에 띄게 높아집니다.


2. AI 영상 실험실 🔬

📋 실험 케이스: 사람만 되는 게 아닙니다 — 동물 캐릭터로 똑같이 실험해봤습니다

이 방법, 캐릭터에도 그대로 쓸 수 있습니다.

마스코트 캐릭터가 있는 기업이라면 바로 적용 가능합니다. 저희가 강아지 캐릭터를 소재로 직접 실험해봤습니다. 순서는 인물 키 비주얼과 완전히 같습니다.

STEP 1. AI에게 캐릭터 페르소나를 작성하게 합니다

첨부 이미지

먼저 AI에게 이렇게 지시합니다.

[프롬프트]

나는 기업 마스코트용 강아지 캐릭터를 AI 영상에 등장시키려고 한다.

이 캐릭터의 외형 일관성을 유지하기 위해,

아래 항목을 모두 포함한 캐릭터 페르소나를 작성해줘.

항목:

- 이름

- 견종 (또는 혼합 견종)

- 체형 (크기, 비율, 전체적인 실루엣)

- 털 색상과 질감 (부위별로 구분)

- 귀 모양과 위치

- 꼬리 모양과 길이

- 눈 색상과 형태

- 코 모양과 색상

- 발 크기와 형태

- 표정 기본값 (중립 상태)

- 캐릭터 무드 (귀여움, 씩씩함, 차분함 등)

- 스타일 (2D 일러스트 / 3D 렌더 / 픽사 스타일 등)

- 특이사항 (점, 무늬, 악세서리 등)

각 항목을 구체적이고 시각적으로 묘사해줘.

모호한 표현은 쓰지 말고, 이미지 프롬프트에 바로 쓸 수 있는 수준으로 작성해줘.

STEP 2. 페르소나를 바탕으로 키 비주얼 4컷을 뽑습니다

첨부 이미지

페르소나가 완성되면, 이 내용을 그대로 이미지 프롬프트에 붙여서 아래 4컷을 순서대로 생성합니다.

컷 1. 정면 전신 (흰 배경) — 기본 레퍼런스 확정용

컷 2. 측면 전신 (흰 배경) — 귀·꼬리·실루엣 측면 고정용

컷 3. 후면 전신 (흰 배경) — 뒷모습 AI 상상 방지용

컷 4. 클로즈업 정면 (흰 배경) — 눈·코·입 표정 디테일 고정용

오히려 캐릭터가 더 심합니다.

AI 학습 데이터에서 캐릭터화된 동물의 뒷모습은 실사 인물보다 훨씬 데이터가 적습니다. 데이터가 부족할수록 AI의 상상이 커집니다. 귀 모양, 꼬리 볼륨, 발 형태가 장면마다 달라지는 이유입니다.

페르소나로 언어를 고정하고, 4컷으로 시각을 고정하면 AI는 창작이 아니라 재현을 합니다. 캐릭터도 마찬가지입니다.


🔑 핵심 KEY POINT

인물이든 캐릭터든, 원리는 하나입니다. AI가 상상할 여지를 미리 없애는 것입니다. 페르소나로 언어를 고정하고, 4컷으로 시각을 고정하면 AI는 창작이 아니라 재현을 합니다.

AI 영상 제작에서 인물 일관성 문제로 고민 중이시다면, 언제든지 저희한테 먼저 물어보세요.



오늘 뉴스레터 어떠셨어요?
아래 버튼을 눌러 의견을 남겨주시면
피드백을 반영해 더 재밌고 유익한 콘텐츠로 찾아올게요.💌

 

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

✉️

이번 뉴스레터 어떠셨나요?

사다리 AI 레터 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글

의견을 남겨주세요

확인
의견이 있으신가요? 제일 먼저 댓글을 달아보세요 !

다른 뉴스레터

사다리 AI 레터와 대화하기
© 2026 사다리 AI 레터

교육/기획/홍보 담당자를 위한 AI 업무 활용, AI 영상 제작 인사이트를 전해드려요.

뉴스레터 문의line@sadarifilm.com

메일리 로고

도움말 오류 및 기능 관련 제보

서비스 이용 문의admin@team.maily.so 채팅으로 문의하기

메일리 사업자 정보

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울특별시 송파구 위례광장로 199, 5층 501-8호

이용약관 | 개인정보처리방침 | 정기결제 이용약관 | 라이선스