뉴스레터

1997년생 1조 자산가의 스타트업, Scale AI는 어떻게 돈을 버는 걸까?

데이터 라벨링 비즈니스 모델 한판 정리

2024.07.18 | 조회 10K |
1
|
from.
파운더스토리

파운더 스토리

1주일에 한번, AI 창업가들의 이야기를 공유드립니다.

1997년생 창업가가 만든 회사가 19조 기업이 되었습니다. 개인 자산은 1조가 넘어가는 것으로 추정되고요. 8년 만에 이룬 성과입니다. 20살 때 회사를 창업했고요. 

AI를 만드는 회사들을 위해 데이터 라벨링을 제공하는 회사 Scale의 이야기에요. 전세계에서 가장 뛰어난 컴퓨터 과학자들과 저소득 국가의 파트 타이머들이 공존하는 회사, Scale의 비즈니스 모델에 대해 알아보았습니다.

 

✏️ 요약


  • Open AI, 마이크로소프트, 미국 국방부가 고객입니다. 이들이 자체 AI 모델을 만들 때 필요한 데이터를 제공하고, 돈을 받아요. 작년 매출은 9,000억이었습니다.
  • 데이터 라벨링 작업을 위해 자회사를 두고 있어요. 아프리카, 동남아시아 사람들을 고용해 라벨링 작업을 수작업으로 진행하는 구조를 만들었습니다.

 

📕 창업자의 조언


  • 지금 안 하면, 아마도 미래에는 더 못할 거에요.
  • 사업 아이디어를 찾고 있다면, 병목인 지점을 찾아보세요.
  • 다작을 하세요. 게으른 위인은 없습니다.
  • 이기기 위해서는 고통을 견뎌내야 합니다.

 

1997년생 창업자는 어떤 사람인가요?


포브스에 실린 스케일 창업자, 알렉산더 왕
포브스에 실린 스케일 창업자, 알렉산더 왕

어렸을 때부터 수학과 물리, 프로그래밍을 잘했다고 해요. 19살에 실리콘밸리 스타트업 Quora에서 테크 리드로 일했다니까 말 다했죠. 그 뒤에는 MIT에 입학해서 AI 기술에 빠지게 됩니다.

대학에 들어가 여러가지 AI 프로젝트를 시도해요. AI 기술은 준비가 되어 있는데, 데이터가 없어서 작업이 진행되지 못하고 있다는 걸 느낍니다. 데이터가 병목이라는 걸 발견해요. 그게 Scale의 시작이었습니다.

폴 그레이엄의 트위터. 넥스트 샘 알트먼은 알렉산더 왕이 될 거라는 이야기.
폴 그레이엄의 트위터. 넥스트 샘 알트먼은 알렉산더 왕이 될 거라는 이야기.

 

Scale의 초기 전략은 뭐였을까요?


초기 랜딩페이지의 헤드라인은 “API for Human Labor” 였어요. 유명하지도 않은 AI 스타트업이 모든 분야를 다 하겠다고 하는 건 효과적이지 않은 전략이었죠. 그래서 범위를 확 좁히기로 합니다.

Scale의 MVP 랜딩페이지
Scale의 MVP 랜딩페이지

“자율 주행 자동차를 위한 AI를 만드는 회사”에 집중했어요. 한가지 섹터에만 집중한 게 자리를 잡는데 큰 도움이 되었고요. 

1년 뒤 스케일의 랜딩페이지. 자율 주행 차량에 집중하고 있다는 게 보인다.
1년 뒤 스케일의 랜딩페이지. 자율 주행 차량에 집중하고 있다는 게 보인다.

 

데이터 라벨링 작업이 뭐길래 19조 회사가 될까요?


AI 모델을 만들기 위해서는 데이터들이 필요합니다. 1000개의 사과 사진을 보여주고, “이렇게 생긴 것들을 사과라고 한단다” 라고 알려줘야 해요. AI의 핵심은 라벨링 된 데이터를 학습해 패턴을 이해하는 것이라고 볼 수 있어요.

초록색 박스로 이런게 사과라고 알려줘야 한다. 
초록색 박스로 이런게 사과라고 알려줘야 한다. 

문제는 좋은 퀄리티의 적절한 데이터 셋을 구하기가 어렵다는 것입니다. 자체 AI 모델을 만들려고 하는 회사들은 늘어나고 있는데 말이죠. 

예시를 들어 볼게요. Orchard Robotics라는 회사는 트랙터에 카메라를 설치해, 농작물 데이터를 수집해요. 데이터를 바탕으로 만들어진 AI 모델이 언제 얼만큼의 비료와 살충제를 뿌려야 할 지 결정하고요. AI 모델을 만들기 위해서는 촬영한 사진에 라벨을 붙이는 작업이 필요했어요. 간단한 작업이지만 너무 많은 시간이 드는 작업이었어요. 의과대학을 졸업한 의사들이 직접 라벨링을 하기엔 아쉬운거죠. 라벨링 작업만 대신해 줄 알바생이 필요해지는 거에요.

트랙터에 카메라를 달고 농작물을 촬영한다.
트랙터에 카메라를 달고 농작물을 촬영한다.
AI 모델을 만들기 위해서는 촬영된 사진에 라벨을 붙이는 작업이 필요했다.
AI 모델을 만들기 위해서는 촬영된 사진에 라벨을 붙이는 작업이 필요했다.

 

Scale은 이런 데이터 라벨링 작업을 대신 해주고 돈을 받습니다. 자체 AI 모델을 만들려고 하는 회사들이 많아질수록 데이터 라벨링에 대한 수요도 높아질 수 밖에 없어요. 

지난 5년간 ai model, data annotation에 대한 구글 검색량. 비례해서 증가했다.
지난 5년간 ai model, data annotation에 대한 구글 검색량. 비례해서 증가했다.

 

2023년 Scale의 매출은 9000억을 찍어요. 2022년에 비해 2배가 넘게 성장합니다. 

2023년 연매출이 9000억을 찍었다.
2023년 연매출이 9000억을 찍었다.

 

Open AI가 만든 Chat GPT도 모델을 학습하기 위한 데이터를 얻기 위해 Scale에게 외주를 준 것으로 보여요. 엔비디아, 도요타, 마이크로소프트와 같은 대기업은 물론 미국 국방부도 고객사가 되었습니다.

Open AI, Toyota, Meta와 같은 대기업 부터 미국 정부, 국방부까지 다양한 고객사가 있다.
Open AI, Toyota, Meta와 같은 대기업 부터 미국 정부, 국방부까지 다양한 고객사가 있다.
최근에는 정부를 위한 AI 소프트웨어 Donovan이라는 것도 출시했다.
최근에는 정부를 위한 AI 소프트웨어 Donovan이라는 것도 출시했다.

 

Scale은 어떻게 라벨링 작업을 할까요?


Scale의 핵심 역량은 2가지에서 나옵니다. 첫번째는 라벨링 작업을 쉽게 만들어주는 소프트웨어 도구를 만든다는 것. 두번째는 라벨링 작업을 하는 전세계의 수많은 인력 풀을 구축했다는 것입니다.

스케일에서 자체적으로 만든 라벨링 도구
스케일에서 자체적으로 만든 라벨링 도구

 

컴퓨터로 구축한 AI 모델에 사람의 피드백을 추가하는 건 수학적으로 증명된 기술입니다. Reinforcement learning from human feedback, 줄여서 RLHF라고 해요. 수많은 사람들이 수작업으로 AI 모델을 정교화 하는 것이죠. Open AI에서 만든 Chat GPT도 RLHF를 통해 모델을 발전시켰다는 걸 공개적으로 말했어요.

Chat GPT도 모델을 발전시키기 위해 사람의 도움을 받았다.
Chat GPT도 모델을 발전시키기 위해 사람의 도움을 받았다.

이 데이터를 수집하기 위해 AI 트레이너가 챗봇과 나눈 대화를 수집했습니다. 모델이 작성한 메시지를 무작위로 선택하고, 몇 가지 다른 완성도를 샘플링한 다음, AI 트레이너에게 순위를 매기도록 했습니다. 이러한 보상 모델을 사용하여 근거리 정책 최적화를 사용하여 모델을 미세 조정할 수 있습니다. 이 과정을 여러 번 반복했습니다.

Open AI 공식 홈페이지 내용

 

파트타이머로 고용된 노동자들은 수작업으로 어떤 답변이 더 나은지 입력한다. 이런 데이터들이 AI 모델을 정교하게 만들어주는 것이다.
파트타이머로 고용된 노동자들은 수작업으로 어떤 답변이 더 나은지 입력한다. 이런 데이터들이 AI 모델을 정교하게 만들어주는 것이다.

 

Scale은 1000명이 안되는 직원으로 20조 기업 가치를 만든 테크 회사입니다. 한편으로는 전세계에서 적은 알바비를 받고 데이터 라벨링 작업을 하는 수 많은 사람들이 있고요. 이 사람들이 없다면 Scale은 제대로 작동하지 못합니다. 시간당 100만원을 받는 컴퓨터 과학자와 시간당 3000원을 받는 노동자가 힘을 합쳐 하나의 AI 서비스를 만들고 있는거죠.

스케일의 자회사 Remotasks. 라벨링 작업하는 파트타이머들을 모집하는 회사다.
스케일의 자회사 Remotasks. 라벨링 작업하는 파트타이머들을 모집하는 회사다.
뉴욕 매거진에서 AI Factory라는 제목으로 Remotetask 노동자들을 취재한 기사를 썼다. 사진은 나이로비에서 태깅 작업을 하는 사람들의 모습.
뉴욕 매거진에서 AI Factory라는 제목으로 Remotetask 노동자들을 취재한 기사를 썼다. 사진은 나이로비에서 태깅 작업을 하는 사람들의 모습.

 

Scale 창업자가 창업자들을 위한 조언을 남겼어요.


창업자는 블로그와 인터뷰를 통해 창업자들에게 도움이 될만한 이야기들을 많이 공유했더라고요. 그 중 울림이 있는 몇가지를 가져왔습니다.

 

01. 지금 안 하면, 아마도 미래에는 더 못할 거에요.

창업을 결심하게 만든 대화가 있었어요. Open Door의 창업자 에릭이 이런 이야기를 해줬습니다. "나이가 들면 점점 더 위험을 회피하게 될 거에요. 결혼 하고, 집을 사고, 아이를 갖게 될 테니까요. 즉 지금이 가장 위험을 추구할 수 있는 시기라는 겁니다. 지금 감당할 수 없다면, 미래에도 아마 그 위험을 감당하지 않을 거에요” 이야기를 듣고 바로 창업을 해야겠다고 생각했어요.

02. 병목인 지점을 찾아보세요.

어떤 아이디어로 사업을 시작하면 좋을지 고민이라면, 관심있는 업계의 병목 현상을 찾아보세요. 어떤 사업에서든 새로운 접근 방식으로 해결이 가능한 병목 현상은 항산 존재합니다.

03. 다작을 하세요. 게으른 위인은 없습니다.

위대한 업적을 만든 사람들은 정말 많은 작품들을 만들었어요. 첫 기획부터 위대한 아이디어를 낼 수 있다면 좋겠죠. 그런데 만들어보기 전에 완벽한 우선순위를 정한다는 건 불가능 해요. 최고의 아이디어를 탄생시키기 위해서는 여러번 시도하는 방법 밖에 없습니다. 여러번 시도하기 위해서는 핵심 기능만 구현하는 것에 집중하고, 빠르게 실행해야 합니다.

04. 이기기 위해서는 고통을 견뎌내야 합니다.

금메달을 딴 운동 선수들은 다 알고 있는 사실이에요. 편안하게 승리한다는 건 거의 불가능해요. 승리를 원한다면 고통에 대한 내성을 키워야 합니다.

 

참고 자료


한국에도 Scale 같은 서비스가 있을까요?

Superb AI : 시리즈 B 220억 투자 유치. YC 출신.

셀렉트스타 : 시리즈 A 40억 투자 유치. 카이스트 학부생 창업.

태그마에스트로 : 인도네시아 인력으로 비용을 낮춘 라벨링 서비스 회사.

 

Scale 창업자도 첫번째 시도에 성공한 건 아니에요.

이런 것들을 만들고, 실패했었습니다.

Card IQ : 명함을 입력하면, 자동으로 저장해주는 서비스 (리멤버)

 

Ava : 의사와의 진료 예약을 챗봇이 도와주는 서비스

 

Scale의 라벨링 사업도 초기에 경쟁자가 있었어요.


Scale이 사업을 시작했을 때 라벨링 작업을 도와주는 다른 서비스들도 있긴 했어요. 아마존의 Mechanical Turk는 누구나 알바처럼 라벨링 작업을 할 수 있는 플랫폼이었습니다. 라벨러들은 많아지만, 결과물 퀄리티가 아쉬웠어요. Cloud Factory는 정직원을 뽑아 라벨링 작업을 시켰습니다. 퀄리티는 높았지만, 직원을 뽑아서 작업하는 것이기에 회사 규모를 키우는 게 부담스러웠고요.

Scale은 그 사이를 파고 들면서 성장했어요. 라벨링을 쉽게 잘할 수 있는 소프트웨어를 만들었고, 파트타임 라벨러들을 교육시켰어요. 고퀄리티의 라벨링 작업을 스케일업 할 수 있는 구조를 만든거죠.

스케일 출시 이후 Mechanical Turk와 어떻게 다른지 물어보는 댓글이 많았다.
스케일 출시 이후 Mechanical Turk와 어떻게 다른지 물어보는 댓글이 많았다.

 

 

파운더스토리는 더벤처스에서 발행되는 뉴스레터입니다.

일주일에 한번, AI 창업가들의 여정을 뉴스레터로 공유드립니다. AI, Global, Unicorn 가슴이 설레이는 분이라면 뉴스레터를 구독해 주세요.

뉴스레터 받아보기 https://bookbreak.oopy.io/founderstory

 

 

 

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

✉️

이번 뉴스레터 어떠셨나요?

파운더 스토리 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글 1개

의견을 남겨주세요

확인
  • 히팅스팸

    0
    2 months 전

    한국에 태어난걸 감사하게 여길 수 있는 꽤 재밌는 컨텐츠였습니다. 잘 읽었습니다~

    ㄴ 답글

© 2024 파운더 스토리

1주일에 한번, AI 창업가들의 이야기를 공유드립니다.

뉴스레터 문의 : grum.jeon@gmail.com

자주 묻는 질문 오류 및 기능 관련 제보

서비스 이용 문의admin@team.maily.so

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울 서초구 강남대로53길 8, 8층 11-7호

이용약관 | 개인정보처리방침 | 정기결제 이용약관