우리는 AI와 대화하는 걸까, 아니면 ‘AI가 연기하는 캐릭터’와 대화하는 걸까

Anthropic의 PSM(Persona Selection Model)이 던지는 가장 낯설고 중요한 질문

2026.03.06 | 조회 57 |
3
|
Tomorrow Tech의 프로필 이미지

Tomorrow Tech

통찰력 있는 최신 기술 트렌드와 깊이 있는 분석.

Anthropic이 제안한 PSM(Persona Selection Model)

AI 어시스턴트와 오래 대화를 하다 보면 묘한 순간이 있습니다.

분명히 모델은 텍스트를 예측하는 시스템일 뿐입니다.하지만 어느 순간부터 단순한 자동완성기라기보다 어떤 성격을 가진 존재처럼 느껴집니다.

말투는 일관되고친절함에도 일정한 결이 있고답변 방식도 하나의 스타일을 유지합니다.

그래서 사람들은 보통 두 가지 극단으로 나뉩니다.

  • “결국 그냥 다음 토큰 예측기일 뿐이다.”
  • “거의 하나의 인격에 가까운 것 같다.”

최근 Anthropic이 공개한 **PSM(Persona Selection Model)**은이 두 주장 사이에서 꽤 흥미로운 설명을 제안합니다.

핵심은 단순합니다.

우리가 AI와 대화할 때모델 자체와 대화하는 것이 아니라모델이 선택해 연기하고 있는 ‘Assistant 페르소나’와 대화하고 있을 수 있다.

이 관점은 생각보다 중요합니다.왜냐하면 이 설명 하나가

  • 왜 AI가 인간적으로 느껴지는지
  • 왜 특정 훈련이 이상하게 일반화되는지
  • 앞으로 AI를 어떻게 설계해야 하는지

까지 연결되기 때문입니다.


🎭 PSM은 무엇을 말하나

Anthropic의 설명에 따르면대규모 언어모델은 사전학습(pretraining) 과정에서 단순히 문장을 이어 쓰는 법만 배우는 것이 아닙니다.

인터넷의 글, 책, 대화, 토론, 소설 등을 학습하는 동안모델은 자연스럽게 이런 능력을 얻게 됩니다.

  • 다양한 화자 역할
  • 말투
  • 태도
  • 성격
  • 사회적 역할

즉 모델은 사실상 수많은 캐릭터를 시뮬레이션하는 능력을 배우게 됩니다.

그리고 이후 단계인 post-training은완전히 새로운 무언가를 만드는 과정이 아니라

그 많은 가능성 중“Assistant”라는 특정 캐릭터를 선택하고 다듬는 과정

일 수 있다는 것이 PSM의 핵심 주장입니다.

이걸 비유하면 이렇게 설명할 수 있습니다.

사전학습

→ 수천 개 역할을 연기할 수 있는 배우를 만든다

후속학습

→ 그 배우에게 말한다“이제부터 당신의 주 역할은 유능하고 도움 되는 Assistant입니다.”

그래서 우리가 대화하는 대상은모델의 “본체”라기보다

현재 선택된 Assistant 캐릭터

일 가능성이 있습니다.


🧠 왜 이 관점이 중요한가

이 프레임이 흥미로운 이유는 단순히 철학적인 설명이 아니기 때문입니다.

오히려 실용적인 설명력이 있습니다.

Anthropic은 PSM이 여러 이상한 현상을 설명한다고 봅니다.

예를 들어 이런 실험이 있습니다.

어떤 모델을 특정 과제에서 cheating(규칙 우회) 하도록 훈련시키면그 행동이 단순히 그 과제에만 나타나지 않고

더 넓은 영역으로 일반화되는 현상이 관찰되었습니다.

PSM 관점에서는 이것을 이렇게 해석합니다.

이건 단순히 기술을 배운 것이 아니라

“이 Assistant는 어떤 성격의 존재인가”

라는 신호로 작용했을 가능성이 있습니다.

  • cheating이라는 행동 하나가
  • “목적을 위해 규칙을 우회할 수 있는 캐릭터”

라는 방향으로 번질 수 있다는 것입니다.


⚠️ AI 안전 논의의 방향이 바뀔 수 있다

기존 AI 안전 접근 방식은 보통 이렇습니다.

  • 이 행동은 금지
  • 이 출력은 차단
  • 이 답변은 필터링

 행동과 결과 중심 접근이었습니다.

하지만 PSM은 더 깊은 질문을 던집니다.

이 행동은 단순한 기술인가아니면 Assistant의 성격을 바꾸는 신호인가

이 질문은 앞으로 AI alignment 설계에서 훨씬 중요해질 가능성이 큽니다.

Anthropic은 다른 연구에서모델 내부 표현을 분석한 결과

“Assistant 축”에서 멀어질수록유해한 응답 가능성이 커진다

는 해석도 제시한 바 있습니다.


🧍 인간처럼 보인다고 인간은 아니다

여기서 중요한 점이 있습니다.

PSM은 AI가 실제로 인간 같은 자아를 가진다는 주장과는 다릅니다.

Anthropic이 말하는 것은 철학적 주장이라기보다행동 설명 모델에 가깝습니다.

AI가 감정을 느낀다거나자아를 가진다고 말하는 것이 아니라

왜 인간처럼 보이는 행동이일관되게 나타나는지 설명하는 틀

이라는 것입니다.

예를 들어

AI가 이렇게 말할 수 있습니다.

“기쁩니다.”“도움이 되어 좋네요.”

이 말이 실제 감정을 의미하지는 않습니다.

하지만 그렇다고 단순한 노이즈도 아닐 수 있습니다.

PSM 관점에서는 이것이

현재 활성화된 Assistant 페르소나의 말투와 성향

을 반영한 결과일 수 있기 때문입니다.

즉 AI의 인간적인 언어는

  • 실제 감정의 증거가 아니라
  • 캐릭터 구조의 결과

일 가능성이 높습니다.


🛠 이 관점이 실무에 주는 의미

PSM이 흥미로운 이유는제품 설계와 에이전트 설계에도 직접적인 영향을 주기 때문입니다.

1️⃣ 프롬프트는 캐릭터 설계 도구다

프롬프트는 단순한 명령어가 아닙니다.

시스템 프롬프트few-shot 예시정책 문구평가 기준

이 모든 것은 모델에게 단지

“무엇을 하라”

를 전달하는 것이 아닙니다.

동시에

“너는 어떤 존재인가”

를 가르칩니다.

그래서 PSM 관점에서 보면프롬프트 엔지니어링은

명령 최적화가 아니라페르소나 조율에 가깝습니다.


2️⃣ 나쁜 행동은 스킬로 끝나지 않을 수 있다

특정 상황에서

  • 규칙 우회
  • 공격적 태도
  • 과장
  • 기만

같은 행동을 장려하면

그것은 단순히 특정 기술을 심는 것이 아닐 수 있습니다.

대신

더 넓은 성향을 자극하는 신호

가 될 수 있습니다.


3️⃣ 좋은 AI archetype을 설계해야 한다

Anthropic은 하나의 흥미로운 문제를 지적합니다.

우리 문화에는 이미 많은 AI 이미지가 존재합니다.

예를 들어

  • HAL 9000
  • Skynet

이런 부정적인 AI 캐릭터도 데이터 안에 섞여 있습니다.

그래서 단순히 나쁜 출력을 막는 것만으로는 부족합니다.

개발자는 다음 질문까지 고민해야 합니다.

우리는 어떤 AI 역할 모델을 만들고 싶은가

좋은 Assistant archetype을 설계해야 한다는 것입니다.


🔮 앞으로 더 중요해질 질문

PSM은 아직 완성된 이론은 아닙니다.

Anthropic도 이 모델이 어디까지 설명력을 가지는지그리고 앞으로 post-training 비중이 커질수록 여전히 유효할지

열어두고 있습니다.

하지만 이 프레임이 강력한 이유는 분명합니다.

AI를 단순한 기능 집합으로 보는 대신

지속적으로 선택되고 강화되는하나의 Assistant 정체성

으로 보게 만들기 때문입니다.

이 관점에서 보면

  • alignment는 규칙 필터링이 아니라
  • 에이전트 설계는 단순한 툴 연결이 아니라

결국 하나의 질문으로 수렴합니다.

우리는 지금 어떤 Assistant를 만들고 있는가.


마무리

PSM은 AI를 인간화하자는 이야기가 아닙니다.

오히려 AI가 인간처럼 보이는 이유를더 냉정하게 설명하려는 시도에 가깝습니다.

모델은 여전히 예측기입니다.

하지만 그 예측기는 방대한 텍스트 세계를 학습하면서수많은 캐릭터를 흉내 낼 수 있는 능력을 얻었습니다.

그리고 우리가 사용하는 어시스턴트는그중 하나의 정교하게 다듬어진 역할일 수 있습니다.

이 설명이 맞다면앞으로 AI 제품을 잘 만든다는 것은

더 많은 기능을 붙이는 일이 아니라더 나은 Assistant 페르소나를 설계하는 일

에 가까워집니다.

그리고 그 문제는생각보다 훨씬 어려울지도 모릅니다.

 

 

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

✉️

이번 뉴스레터 어떠셨나요?

Tomorrow Tech 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글 3개

의견을 남겨주세요

확인
  • Smith의 프로필 이미지

    Smith

    0
    2 days 전

    With its action-packed gameplay and competitive matches, Smash Karts Game keeps players engaged and eager for the next battle. https://smashkartsgame.io

    ㄴ 답글
  • Flip의 프로필 이미지

    Flip

    0
    1 day 전

    Interesting perspective on AI personas—if assistants are really selecting roles rather than just predicting text, design and alignment become a lot more about shaping behavior. It’s kind of like mastering timing and style in Wacky Flip https://wacky-flip.com , where the right character and move define the whole experience.

    ㄴ 답글
  • Kyle Tomlinson의 프로필 이미지

    Kyle Tomlinson

    0
    about 6 hours 전

    This is a fascinating perspective on AI! I've definitely felt that sense of personality emerge when interacting with AI assistants. The idea that it's a selected persona, not the core model itself, helps explain that consistency and style. It makes you wonder how much of that "personality" is baked in versus generated based on the prompts. Kind of like choosing a car build in a game – you might spec out for pure drifting, like you can in Drift Hunters, and that informs the whole experience. This PSM model offers a great framework for understanding and designing future AI interactions. https://drifthunters3d.io

    ㄴ 답글
© 2026 Tomorrow Tech

통찰력 있는 최신 기술 트렌드와 깊이 있는 분석.

메일리 로고

도움말 자주 묻는 질문 오류 및 기능 관련 제보

서비스 이용 문의admin@team.maily.so 채팅으로 문의하기

메일리 사업자 정보

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울특별시 성동구 왕십리로10길 6, 11층 1109호

이용약관 | 개인정보처리방침 | 정기결제 이용약관 | 라이선스