📬 사다리 AI 레터 20호
안녕하세요, 사다리필름입니다.
하반기 채용 영상, 교육 콘텐츠 기획을 슬슬 시작하시는 분들이 많아지는 시기입니다. AI 영상 제작에 도전해보셨거나, 막 시작하려는 분들께 요즘 저희한테 가장 많이 들어오는 질문 하나를 꺼내서 이번 호를 준비했습니다.
오늘 레터에서는
✅ AI 영상 속 인물이 장면마다 달라지는 문제, 구조적으로 해결하는 방법
✅ 사람뿐만 아니라 캐릭터에도 똑같이 적용했더니 — 내부 실험 결과 공개
이렇게 2가지를 나눠드립니다.
담당자 여러분의 업무가 조금이라도 더 수월해지길 바라며, 인사를 마칩니다. 💌
1. 기획자를 위한 AI 레시피 🔦
"장면마다 사람이 바뀐다면 — AI 인물 일관성 지키는 법

어느 목요일 오후, 이런 상황이 생겼습니다.
AI로 교육 영상 초안을 뽑았습니다. 1장면: 30대 여성 강사. 단발머리. 네이비 재킷. 3장면: 머리 색이 바뀌어 있습니다. 5장면: 얼굴형이 달라졌습니다. 7장면: 아예 다른 사람이 나옵니다.
품의서에 올리기 전에 멈추게 되는 순간입니다. "이 사람이 같은 사람 맞나요?"
이런 경험, 한 번쯤 있으시죠?
왜 이런 일이 생기는 걸까요.

원인은 두 가지입니다.
첫째, AI는 매 장면을 독립적으로 생성합니다. 기준 이미지가 없으면, 프롬프트가 같아도 결과가 달라집니다.
둘째, 그리고 이게 더 중요합니다. 정면 이미지 하나만 있으면, AI는 옆모습과 뒷모습을 스스로 "상상"해서 만듭니다. 그 상상이 원본과 전혀 다른 사람을 만들어냅니다.
인물의 여러 각도를 미리 확정해두지 않으면, 일관성은 운에 맡기는 것과 같습니다.
해결은 두 단계로 이루어집니다.
STEP 1. 인물 페르소나를 먼저 언어로 설계하라

"30대 여성 강사"라고 프롬프트를 넣으면, AI가 나머지를 채웁니다. 그 채움이 장면마다 달라지는 원인입니다.
해결은 간단합니다. 이 인물이 누구인지, 먼저 텍스트로 확정해두는 것입니다. AI가 상상으로 채울 여지 자체를 없애는 것이 핵심입니다.
이 페르소나를 바탕으로 이미지 프롬프트를 뽑으면, 매번 "느낌이 비슷한 결과"가 아니라 "같은 인물"에 수렴하는 결과가 나옵니다.
막연할수록 AI의 상상이 커집니다. 구체적일수록 AI의 상상이 줄어듭니다.
STEP 2. 흰 배경 키 비주얼 4컷을 먼저 확정하라

[이미지 자리 1: 키 비주얼 4컷 구성 예시 — 정면/측면/후면/클로즈업]
페르소나가 완성됐다면, 영상 제작에 들어가기 전 아래 4컷을 흰 배경으로 먼저 뽑아서 레퍼런스 이미지로 고정합니다. 최소 4컷 이미지이고, 더 디테일하고 역동적인 무브를 주어야 하는 캐릭터의 경우 더 다양한 각도에서의 키 이미지를 뽑기도 합니다.
측면과 후면을 따로 뽑는 이유가 있습니다. AI는 정면 이미지만 보고 나머지 각도를 추론해 만들어냅니다. 그 추론 과정에서 귀 모양, 뒷머리 볼륨, 어깨 라인이 달라집니다. 미리 확정해두면 AI가 재해석할 여지가 없습니다.

배경을 흰색으로 뽑는 이유는 하나입니다. 이후 어떤 배경에도 잡음 없이 합성할 수 있기 때문입니다.
이 4컷이 확정된 뒤, 이후 모든 장면 생성 시 이 이미지를 레퍼런스로 입력합니다. AI가 인물을 재해석할 여지가 없어집니다.
저희 사다리필름은 Google Flow에서 나노바나나(Nanobana) 엔진을 선택해 작업합니다.
텍스트 페르소나를 프롬프트로 변환한 뒤, 나노바나나 엔진에서 4컷을 순차 생성합니다. 레퍼런스 이미지로 고정하고 나면, 장면 간 인물 일관성이 눈에 띄게 높아집니다.
2. AI 영상 실험실 🔬
📋 실험 케이스: 사람만 되는 게 아닙니다 — 동물 캐릭터로 똑같이 실험해봤습니다
이 방법, 캐릭터에도 그대로 쓸 수 있습니다.
마스코트 캐릭터가 있는 기업이라면 바로 적용 가능합니다. 저희가 강아지 캐릭터를 소재로 직접 실험해봤습니다. 순서는 인물 키 비주얼과 완전히 같습니다.
STEP 1. AI에게 캐릭터 페르소나를 작성하게 합니다

먼저 AI에게 이렇게 지시합니다.
STEP 2. 페르소나를 바탕으로 키 비주얼 4컷을 뽑습니다

페르소나가 완성되면, 이 내용을 그대로 이미지 프롬프트에 붙여서 아래 4컷을 순서대로 생성합니다.
오히려 캐릭터가 더 심합니다.
AI 학습 데이터에서 캐릭터화된 동물의 뒷모습은 실사 인물보다 훨씬 데이터가 적습니다. 데이터가 부족할수록 AI의 상상이 커집니다. 귀 모양, 꼬리 볼륨, 발 형태가 장면마다 달라지는 이유입니다.
페르소나로 언어를 고정하고, 4컷으로 시각을 고정하면 AI는 창작이 아니라 재현을 합니다. 캐릭터도 마찬가지입니다.
🔑 핵심 KEY POINT
인물이든 캐릭터든, 원리는 하나입니다. AI가 상상할 여지를 미리 없애는 것입니다. 페르소나로 언어를 고정하고, 4컷으로 시각을 고정하면 AI는 창작이 아니라 재현을 합니다.
AI 영상 제작에서 인물 일관성 문제로 고민 중이시다면, 언제든지 저희한테 먼저 물어보세요.
오늘 뉴스레터 어떠셨어요?
아래 버튼을 눌러 의견을 남겨주시면
피드백을 반영해 더 재밌고 유익한 콘텐츠로 찾아올게요.💌
의견을 남겨주세요