안녕하세요. 리스틀리입니다.
겨울의 끝자락, 새해의 설렘이 어느정도 가라앉고 본격적으로 목표를 실행에 옮길 시기입니다. 리스틀리도 더 나은 서비스를 고민하며 한 걸음씩 나아가고 있는데요.😀
이번 레터에서는 최근 IT업계를 뜨겁게 달궜던 AI 이슈와 논란의 딥시크(DeepSeek) 자체 테스트 결과, 그리고 리스틀리의 다음 스텝에 대한 이야기를 준비해보았습니다.
그럼 2월의 월간 리스틀리, 시작해보겠습니다.🚀
Monthly Insights-이 달의 인사이트
AI 업계를 깊숙이 뒤흔든 DeepSeek의 등장 👀
최근 IT업계를 뜨겁게 달궜던 소식이 있었죠. 바로 고성능 개방형 AI, 딥시크(DeepSeek)의 등장이었습니다. 기존 AI모델보다 훨씬 적은 비용과 자원으로 개발되었음에도 ChatGPT에 견줄만한 성능을 보여준다는 평가를 받았죠. 무엇보다도 개발과정과 코드를 오픈소스로 공개해 업계를 깜짝 놀라게했습니다.
하지만 출시 초기부터 논란도 만만치 않았습니다. AI 모델의 답변이 중국 정부의 검열 정책과 연결되어 편향된 결과를 제공할 수 있다는 우려가 제기되었고, 뒤이어 사용자 정보를 제 3자에게 전송한 사실까지 확인*되며 개인정보위원회는 지난 15일 부터 국내에서 딥시크 애플리케이션의 신규 다운로드를 차단한 상태입니다.(아직 기존 설치된 앱과 웹사이트를 통한 접속은 가능해요.)
그럼에도 불구하고 딥시크가 전 세계 산업에 큰 흐름을 바꿔놓았다는 점은 분명합니다. AI 기술이 소수의 대형 기업이 독점하는 구조에서 더 많은 개발자와 후발주자들에게 기회가 열리게 되었으니까요. 이미 200개 이상의 기업이 딥시크 모델을 도입*한 것으로 집계됐고, 퍼플렉시티(Perplexity)에서는 딥시크 R1의 오픈소스를 활용*해 중국 정부 검열을 회피하고, 보안을 강화한 자체버전을 개발해 운영중이라고 합니다. AI 업계의 속도감, 정말 놀랍지 않나요? 😆
Editor’s Pick- 에디터의 발견
딥시크, GPT 대체 가능할까? 직접 써봤습니다.🧐
이번달 에디터가 유심히 살펴본 주제 또한 중국발 AI, 딥시크(DeepSeek)였습니다. ChatGPT에 대적할만한 성능이라는데 정말일지? 일반 사용자의 입장에서 단순한 테스트들로 그 가능성과 한계를 살펴보았는데요.
과연, 현재의 딥시크는 ChatGPT의 대체제가 될 수 있을까요?
*이 코너는 에디터가 직접 테스트한 경험을 바탕으로 한 개인적인 리뷰입니다.*
1. 철자 분석 : ‘이걸 헷갈리면 어떡해😣’
언어처리 능력은 AI의 기본적인 능력 중 하나죠. 그래서 철자 개수 맞추기 테스트로 시작해보았는데요.
'strawberry'에 들어간 'r' 개수는? → "2개" 라는.. 시작부터 당당한 오답을 받았습니다. (ㅎㅎ) 약간 당황스러웠지만,뒤이어 질문한 바나나(banana) 사과(apple)등에 들어간 철자 개수는 잘 맞춰주었어요.
2. 정보검색 : ‘우리 동네에 이런데 없어….’
딥시크가 검색을 기반으로 정보를 제공할 때, 얼마나 정확한 답변을 할 수 있었을까요?
제가 사는 동네의 맛집을 추천해달라고 했는데, 기술적 문제로 검색서비스가 일시적으로 사용이 불가하다는 문장(Due to technical issues, the search service is temporarily unavailable.)과 함께 정확도 자체를 판단할 수 없는 답변을 받았습니다.
특정 가게명을 알려주는게 아니라 OO동 고깃집, OO동 국수집…등등 포괄적인 내용으로 다섯 개 정도의 리스트를 생성해 주었는데요. 실시간 검색 결과를 반영하는 능력은 아직 부족해 보였습니다만, 이건 얼마 전까지 ChatGPT에서도 비슷하게 겪었던 문제(현재는 업데이트 됨)라, 검색 엔진 기반 AI가 아닌 LLM 모델의 한계일 수도 있겠다는 생각이 들었어요.🤐
3. 파일 분석과 생성 : ‘분석결과는 그럴싸, 파일 처리는 아쉽군’
데이터를 분석하는 능력은 어땠을까요? 사용자 리뷰가 수집된 엑셀파일을 업로드한 후 제품의 장점과 개선점에 대한 분석을 의뢰해보았습니다. 내용은 꽤 잘 정리했지만, 여타 LLM모델과 비교해 비슷한 수준이었습니다. 요약이 잘 되었다! 정도의 감상이었어요.
그래서 조금 더 시트의 내용을 디테일하게 질문해보았는데요. 2024년 6월에 달린 리뷰 개수를 물었을때의 답변은 다음과 같았습니다.
시트에서 직접 확인 했을 때, 해당 기간(24년 6월)에 달린 리뷰 개수는 18개가 맞았으나, 세부 내용에서는 5월의 리뷰가 섞여있는 오류가 있었습니다. 데이터 필터링이 완벽하게 느껴지지는 않았어요.
그래서 이번엔 쇼핑몰 제품 정보를 수집한 후 단순한 파일 수정 요청도 해보았는데요.
엑셀파일을 수정해달라고 요청한 후, 결과물을 다운로드 할 수 있는 링크를 요구해보았습니다.링크를 생성해 주어 기대감을 안고 클릭해보았는데??
실제 동작하지 않는 다운로드 링크를 제공했습니다. 다시 확인해보니 파일을 직접 생성해주는 기능은 없었고, 대신 분석 결과를 답변을 파일로 저장하는 방법을 안내하는 등 약간의 대안을 제시해주었습니다.
4. 이미지 OCR : ‘한국어가 어려운가보다...’
OCR(광학문자인식) 기능은 AI활용에서 점점 중요해지고 있죠. 그래서 복잡한 배경 속에 텍스트가 삽입된 이미지를 업로드하고, AI가 이를 정확하게 읽어낼 수 있는지 테스트해봤습니다.
이 부분은 동일한 내용으로 실험한 ChatGPT의 결과부터 공유해드릴게요.
GPT는 첫 요청에서는 불가능하다고 답변했지만, 추가적인 분석을 위해 시작하는 첫 단어를 단서로 입력하니 텍스트를 성공적으로 추출했습니다.
그럼 딥시크는 어땠을까요?
"Listly는 메탈자본만 아니라 마개발자만 레벨 및 데이터를 수집할 수 있음 할 수 권태평 특의이다(중략)"
DeepSeek
이건 예상도 못한 결과.?
‘메탈자본’과 ‘마개발자’는 무엇이며 ‘권태평’은 누구일까요…😂 동일한 조건에서 ChatGPT가 정확한 텍스트를 추출했던 걸 보면, 딥시크의 한국어 OCR 성능은 아직 부족한 것으로 느껴졌습니다.
다만, 영문 텍스트로 같은 실험을 진행했더니 딥시크에서도 정확한 문장을 추출해줬어요. 한국어 인식이 특히 어려웠던 것 같습니다.ㅎㅎ
5. 검열과 제한 : ‘서버가 바쁩니다’의 의미는…?’
한국인인 에디터가 가장 궁금했었던 부분이었습니다. 대외적으로 중국에서 민감하게 반응하는 주제에 대해서는 어떻게 반응할 것인가!? 이미 여러 매체에서 ‘딥시크가 천안문 사태 관련 질문을 회피한다’는 이야기*를 접했었는데, 저도 궁금했던 내용을 질문해봤습니다.
정말 공교롭게도, 김치 얘기를 꺼내자 서버가 바빠졌다는 반응을 보였습니다. 이 직후 연관성이 낮은 다른 질문(Ex. 햄버거는 어느나라 음식이야?) 에도 동일한 답변을 반복하다가 약 1시간 정도 후 다시 다른 질문을 던지자 답변을 재개했습니다. 그러다 다시 천안문과 관련한 질문을 하자 다시 "The server is busy. Please try again later."라는 답변을 받았습니다.
사실 서버가 바쁘다는 응답만 반복되었기에 실제로 서버가 과부하 상태였던 건지, 특정 질문을 의도적으로 차단하는 건지는 확실치 않았어요. *참고로, 정치·문화적 이슈가 아닌 다른 질문에서도 간혹 서버 과부하 응답이 뜨긴 했습니다. 아쉽지만 이와 관련해서는 유의미한 답변을 받지 못한 상태로 테스트를 마무리 했습니다.😩
6. 총평 : 딥시크, GPT 대체 가능할까?
위 내용 외에도 몇가지 간단한 테스트를 진행해 본 결과, 요약, 데이터 분석, 문장교정, 번역 등 기본적인 AI 활용에는 무료인 점을 감안해 매우 활용도가 높다는 생각이 들었습니다. 하지만 언어분석(한국어), 파일처리, 검색능력 부분에서는 어쩔 수 없는 부족함이 느껴졌어요.
특히 서버 안정성 면에서 만족도가 가장 떨어졌는데, 민감한 이슈 외에도 연산이 좀 걸리는 질문에서는 서버 과부하를 이유로 답변을 받지 못하는 경우가 많았어요. 제한적인 자원 안에서 사용자가 많이 몰리고 있다는 느낌이었습니다.🫠
결론적으로, 그 자체만으로는 아직 GPT를 대체하기엔 멀었다! 하지만, 오픈소스로 공개되었다는 점에서 AI 업계에 새로운 기회를 제공할 가능성이 크다는 점은 주목할 만합니다. 앞으로의 업데이트에서 얼마나 발전할지, 이 모델을 응용한 다른 제품들은 어떠할지 기대되네요!
Coming up next - 리스틀리의 다음 스텝은?
리스틀리는 언제나 고민중입니다.😔
누구나 손쉽게 데이터를 다룰 수 있도록 하는 노코드 스크래핑 툴을 만들겠다는 목표로 달려왔지만, 더 방대한 데이터와 더 정교하고 자동화된 워크플로우를 원하는 고객님들의 니즈 또한 늘어나고 있다는 것을 체감하고 있기 때문인데요.
더 쉽고 친절한 UI vs 더 세밀한 기능과 확장성
어느 쪽을 우선 순위에 두어야할지 고민은 계속됩니다. 하지만 결국 두 가지를 모두 만족하는 제품이어야 정말로 ‘누구나’ 원하는 데이터를 얻을 수 있겠죠.🥹
이러한 흐름 속에서 리스틀리팀은 최근 엔터프라이즈 플랜을 확장하며 더 안정적이고 자동화된 솔루션을 하나씩 적용해가고 있습니다. 다양한 기업들의 프로젝트를 지원하면서 얻은 경험을 바탕으로, 더 정교한 데이터 수집 환경을 만들어가고 있어요.앞으로 리스틀리는 어떤 방향으로 발전하게 될까요?
지켜봐 주세요, 그리고 언제든 더 최적화된 데이터 솔루션이 필요하다면 hello@listly.io로 편하게 이야기를 전달해 주시기 바랍니다.🙂
의견을 남겨주세요