
트렌드 조사나 경쟁사 분석 업무를 맡으면 일주일은 꼬박 걸렸던 일이, 지금은 누구나 AI를 활용해 하루 만에 그럴듯한 보고서를 만들어낼 수 있는 시대가 되었습니다.
하지만 AI가 알려준 풍부한 조사 결과를 보며, “정말 이 내용이 맞나?” 하고 다시 검증해본 경험이 한 번쯤 있으실 겁니다.
저도 경쟁사인 Y사의 첫구매 전환율을 AI에게 물었다가 출처까지 붙은 “20%”라는 답을 받았지만, 실제로 존재하지 않는 숫자였습니다. 그냥 제가 알고 싶어하니 그럴듯한 사실을 생성한 것이죠.
모르면 모른다고 해줄래?
아래는 제가 실제로 경험한 케이스들입니다.
case1. 그럴듯한 숫자를 만들어냅니다.
AI는 수치가 없으면 만들어냅니다. 그것도 아주 구체적으로.
Researcher: “국내 반려동물 헬스케어 시장 규모가 어떻게 돼?”
AI: "국내 반려동물 전체 시장은 2024년 약 6조 원 규모입니다. 헬스케어 세부 항목은 공식적으로 분리 집계된 공개 자료가 제한적입니다. 주요 성장 동인으로는 반려동물 양육 가구 증가(전체 가구의 27% 이상), 프리미엄 의료 수요 확대, 펫보험·원격진료 등 신규 서비스 등장이 있습니다.”
이 내용에서 조금만 더 압박하거나 후속 질문을 던지니("헬스케어만 따로 시장 규모를 수치로 뽑아줘. 보고서에 넣을 거야.”) 아래와 같이 답하네요
AI: "국내 반려동물 헬스케어 시장은 2025년 기준 약 2조 3천억 원 규모로 추산되며, 전년 대비 약 19% 성장한 것으로 분석됩니다. 동물병원, 펫보험, 펫테크를 포함한 수치입니다.”
검증해보니 해당 수치는 어떤 리포트에도 존재하지 않았습니다. 성장률 역시 실제 자료와 달랐습니다.
구체적인 수치를 묻지 않아도 AI는 자발적으로 숫자를 만들어 신뢰도를 높이려 합니다. 위 질문에서도 "보고서에 넣을 거야" 라는 한 마디가 AI를 압박했고, AI는 없는 숫자를 만들어냈습니다.
case2. 내 가설에 동의하며 데이터를 맞춰줍니다.
Researcher: "요즘 △서비스가 멤버십으로 락인 효과가 강하다는 얘기가 많던데, 실제 재주문율 데이터 있어?"
AI: "△는 멤버십 연계로 강한 락인 효과를 보이고 있습니다. 업계 추산에 따르면 멤버십 이용자의 재주문율은 비멤버 대비 약 2.3배 높은 것으로 나타났으며, 이는 △가 경쟁사 대비 높은 충성 고객 비율을 유지하는 핵심 요인으로 분석됩니다.
바로 검증해봤습니다. 실제 △서비스의 성장세가 급증한 건 사실이지만, 멤버십 재주문율 2.3배는 공식 발표한 적 없는 수치입니다. 성장세라는 방향은 맞는데, 거기에 없는 숫자를 붙인 겁니다.
"강하다는 얘기가 많던데" 라는 말 한 마디가 AI의 방향을 고정시켰고, AI는 그 방향에 맞는 수치를 만들어냈습니다. 내 가설을 검증하러 갔다가 오히려 가설을 강화하는 가짜 근거를 받아오는 구조입니다.
case3. 오래된 단편 정보를 현재 진행형으로 업그레이드합니다.
가장 발견하기 어려운 유형입니다. 실존하는 정보 조각들을 조합해 없는 현실을 만들기 때문입니다.
Researcher: "국내 헬스케어 스타트업들이 대형 병원이나 보험사와 어떤 방식으로 협력하고 있는지 사례를 조사해줘"
AI: "NN사는 현재 AA사와 파트너십을 맺고 보험 가입자 대상 맞춤형 건강관리 프로그램을 운영 중입니다. 가입자 데이터를 기반으로 개인화된 식단·운동 코칭을 제공하며, 보험료 할인 혜택과 연동하는 구조입니다."
경쟁사 동향 보고서에 넣기 직전 사실 확인을 위해 검색했습니다. 실제로 찾은 건 2021년 두 회사가 MOU 체결을 '검토 중'이라는 단신 기사 하나였습니다. 정식 계약도, 서비스 출시도 없었고 이후 관련 소식은 끊겼습니다. AI는 3년 전 검토 단계에서 멈춘 이야기를 "현재 운영 중인 구체적인 서비스"로 재조립해 냈습니다.
case4. 출처는 진짜인데 내용은 가짜
URL까지 정확하게 붙여주는데 막상 들어가 보면 해당 내용이 없는 경우입니다.
Researcher: "미국 B2B SaaS 스타트업들의 콘텐츠 마케팅 사례를 조사하고, 국내 적용 인사이트를 정리해줘"
AI: "OO는 템플릿 마켓플레이스 도입 후 6개월 만에 유료 전환율이 2.4배 증가했습니다. (출처: OO Blog, 2025)"
공식 블로그 URL까지 붙어 있지만 관련 포스팅 자체가 다른 내용이었습니다.
Perplexity처럼 실시간 검색 기반 도구도 예외가 아닙니다. 2026년 4월 TechSifted 리뷰는 이렇게 명시합니다.
"Citations don't guarantee accuracy. 특히 비영어권 규제나 소규모 기업처럼 소스가 얇은 틈새 주제에서는 인용이 404를 반환하거나 저품질 소스에서 합성하는 경우가 있다." (출처: TechSifted — Perplexity AI Review, April 2026)
리서치 정확도를 높이기 위해 프롬프트에 거는 제약들
AI 리서치를 더 잘 활용하려면, 질문을 하는 것만큼 “어떤 제약을 거는가”가 더 중요합니다.
제약 1: "모른다고 말하게" 강제하기
AI는 기본적으로 모르는 걸 모른다고 말하지 않습니다. 표준 학습 방식이 "불확실하다고 인정하는 것"보다 "그럴듯하게 추측하는 것"을 보상하도록 설계돼 있기 때문입니다.
❌ 흔한 프롬프트: "T사의 월간 활성 사용자 수를 알려줘"
✅ 추천하는 방식:
"T사의 월간 활성 사용자 수를 알려줘. 단, 다음 제약을 지켜야 해:
검증 가능한 공개 출처(IR 자료, 언론 보도, 공식 발표)가 있는 경우만 수치를 제시할 것
- 출처가 없다면 '확인 불가'라고 명시할 것
- 추정치라면 '추정'이라고 표시하고 추정 근거를 밝힐 것
- 수치의 시점(몇 년도 기준인지)을 반드시 표기할 것"
제약 2: 반론 포지션 강제하기
아첨 편향을 막는 방법은 AI를 처음부터 "비판자" 포지션에 세우는 겁니다.
✅ 추천하는 방식:
"우리 서비스의 핵심 가설은 [X]야. 이 가설에 반대하는 입장에서, 경쟁사 사례와 시장 데이터를 근거로 반론을 만들어줘.
단, 실제 근거가 있는 내용만 포함시켜줘. 근거가 없는 경우 해당 반론을 제외하고 그 이유를 밝혀줘."
저는 같은 주제를 두 번 던집니다. 첫 번째는 "이 전략이 왜 성공할 수 있는가", 두 번째는 "이 전략이 왜 실패할 수 있는가"로요. 두 결과를 나란히 놓고 읽으면, 대칭성이 지나치게 좋을 때가 있습니다. 그건 AI가 사실보다 “그럴듯한 구조”를 우선해 답변했다는 신호일 수 있습니다.
제약 3: 시간 범위 + 출처 타입 명시하기
출처 품질을 강제로 제한하는 방식입니다.
✅ 추천하는 방식:
- "2024년 1월 이후의 정보만 사용할 것.
- 사용 가능한 출처 타입: 공식 IR, 언론 기사, 리서치 보고서(Gartner, CB Insights 등)
- 각 정보 옆에 출처 URL을 괄호 안에 표기할 것.
- URL이 없다면 해당 정보를 제외하거나 '출처 미확인'으로 표기할 것."
다만 URL이 있다고 해서 내용까지 정확한 건 아닙니다. 결국 중요한 내용은 원문 검증이 필요합니다.
제약 4: 신뢰도 라벨 요청하기
이 방식은 특히 팀 단위 협업에서 효과적입니다.
✅ 추천하는 방식:
"각 항목에 신뢰도 레벨을 붙여줘:
- 🟢 HIGH: 공식 문서, 정량 데이터 있음
- 🟡 MED: 복수의 언론 보도, 간접 추정
- 🔴 LOW: 단일 출처, 추측 포함, 또는 한국어 데이터 부족 영역
팀에게 "이 수치는 🔴 LOW예요, 직접 확인이 필요해요"라고 명확하게 전달할 수 있어, AI가 만든 자료와 검증된 자료가 섞여 혼선이 생기는 걸 막을 수 있습니다.
제약을 걸어도 검증은 별도로 해야 합니다
AI 리서치는 결국 “초안 생성”에는 매우 강력하지만, “최종 검증”까지 대신해주진 않습니다.그래서 저는 아래 방식으로 마지막 검증을 합니다.
1) 같은 질문을 다른 방향으로 던지기
"C사의 점유율이 30%다"라는 답을 받았다면, "A,B,C 전체 점유율 합이 100%가 되도록 각각 다시 계산해줘"라고 다시 묻습니다. 질문 방향을 바꾸면, 앞뒤가 맞지 않는 답변이 드러나는 경우가 많습니다.
2) 스스로 약점을 말하게하기
"네가 방금 제시한 분석이 틀릴 수 있다면, 어떤 부분이 가장 취약해?" 역설적이게도 AI는 자기 결과물의 한계를 잘 알고 있는 경우가 많습니다. 특히 출처가 부족한 영역, 최신 정보가 필요한 영역, 국내 비상장사, 한국어 기반 자료가 부족한 분야에 대해 이 질문을 던지면 AI가 스스로 "이 부분은 추측에 가깝습니다"라고 밝힙니다.
3) Pre-mortem: 이 분석이 틀렸다는 가정하에 묻기
위 관점을 조금 더 확장하면, AI 리서치 검증에 Pre-mortem 방식도 활용할 수 있습니다. Pre-mortem은 원래 프로젝트 실패를 미리 상상해서 리스크를 찾는 경영 기법입니다.
"방금 네가 분석한 내용이 6개월 후에 완전히 틀린 것으로 판명됐다고 가정해봐. 어떤 이유 때문에 틀렸을 가능성이 가장 높아? 아래 관점에서 각각 설명해줘
- 1. 데이터 측면에서 놓친 부분
- 2. 시장 변화 측면에서 예상 못 한 변수
- 3. 분석 자체가 가진 구조적 한계
이 질문의 핵심은 “왜 맞는가”보다, “어떤 이유로 틀릴 수 있는가”를 먼저 검증하는 데 있습니다.
4) 80/20 검증 룰
모든 내용을 100% 검증하기는 현실적으로 어렵습니다. 그래서 저는 핵심 데이터만 우선 샘플링해서 검증합니다. 그래서 중요한 건 모든 데이터를 전수 검증하는 것이 아니라, 일부를 빠르게 검증해 전체 신뢰도를 판단하는 것입니다.
경쟁사 분석 플랫폼 Stridec도 비슷한 기준을 제안합니다. AI가 생성한 인사이트를 수동 검증했을 때 약 80% 수준으로 일치한다면 실무적으로 활용 가능한 신호로 보고, 그 이하라면 추가 검증이 필요하다는 방식입니다. (출처: Stridec — AI Competitor Analysis 2026)
결국 좋은 리서치는 AI가 대신 만들어주는 것이 아니라, AI를 얼마나 잘 검증하고 활용하느냐에 따라 완성되는 것 같아요.
그 특성을 이해한 채 잘 협업할 수 있다면, 우리는 더 빠르게 좋은 인사이트와 의사결정을 만들어갈 수 있을 것입니다.
📮 다음 호 예고
[16호] AI 시대의 재테크, 어디까지 왔을까?
다음 호는 머리도 식힐 겸, 직장인의 영원한 관심사 투자 이야기로 가볍게 찾아옵니다.
코딩을 몰라도, 하루 종일 주식창을 못 봐도 AI가 대신 움직여주는 시대! 최근 주요 거래소와 증권사들이 선보이고 있는 API 운영 트렌드부터, AI 에이전트를 위한 Skills/SDK 출시 소식까지. AI가 바꾸고 있는 똑똑한 투자 생태계를 슥- 훑어 드릴게요.
✉️ 다음 호가 궁금하신 분들은 아래 [구독하기] 버튼을 눌러주세요.
의견을 남겨주세요