개발이야기

[dailyNews]사카나 AI, ‘적응형 AI’ 기술 공개

– LLM의 새로운 진화

2025.01.25 | 조회 346 |
0
|
Tomorrow Tech의 프로필 이미지

Tomorrow Tech

통찰력 있는 최신 기술 트렌드와 깊이 있는 분석.

첨부 이미지

📰 사카나 AI, ‘적응형 AI’ 기술 공개 – LLM의 새로운 진화

2025년 1월 15일, 사카나 AI가 대형언어모델(LLM)의 한계를 극복할 혁신적인 기술을 발표했습니다. 새로운 머신러닝 프레임워크 트랜스포머²(Transformer²)는 재훈련 없이도 실시간으로 LLM의 성능을 미세 조정할 수 있는 적응형 AI(Self-Adaptive AI) 기술을 선보이며 주목 받고 있습니다.


🔍 왜 ‘트랜스포머²’가 중요한가?

기존의 LLM 미세조정은 전체 매개변수를 업데이트해야 해 높은 비용과 시간이 필요했습니다. 이를 해결하기 위해 등장한 ‘매개변수 효율적 미세조정(PEFT)’ 기술, 예컨대 로라(LoRA)는 일부 매개변수만 조정해 효율성을 높였지만, 성능 저하와 과적합 문제에서 자유롭지 못했습니다.

이에 비해 트랜스포머²는 두 단계의 적응 전략을 통해 효율성과 성능을 동시에 극대화합니다:1️⃣ 작업 분석: 모델이 주어진 작업을 분석해 필요한 부분만 조정.2️⃣ 실시간 적응: 가중치의 중요한 부분을 조정해 새로운 작업에 신속하게 대응.


🧠 ‘트랜스포머²’의 작동 원리

1. 특이값 분해(SVD)로 가중치 분해

  • LLM 가중치 행렬을 여러 독립적인 구성 요소로 나눕니다.
  • 각 구성 요소는 특정 작업에서 중요한 역할을 수행하며, z-벡터라는 표현으로 작업에 특화된 역할을 담당합니다.

2. 특이값 미세조정(SVF)

  • SVF는 강화 학습(RL)을 사용해 z-벡터를 학습하고, 작업별로 적응 가능한 모델을 만듭니다.
  • 예를 들어, 수학 문제에 필요한 z-벡터와 언어 이해 작업에 적합한 z-벡터를 각각 선택하고 결합하여 최적의 결과를 생성합니다.

📈 벤치마크 성능

🚀 성능 향상

  • 수학 문제 해결: GSM8K 데이터셋에서 약 4% 성능 향상.
  • 시각적 질문-답변: 39% 이상의 성능 향상.
  • 프로그래밍 작업: 더 적은 매개변수로 높은 정확도와 효율성 달성.

💡 자원 절약

  • GSM8K에서 SVF는 39만 개의 매개변수로 훈련을 완료한 반면, 기존 로라는 682만 개의 매개변수를 필요로 했습니다.

🌟 적응형 AI: ‘살아있는 지능’의 구현

사카나 AI는 이 방식을 ‘적응형 AI(Self-Adaptive AI)’로 정의합니다.이 기술은 문어가 환경에 따라 색을 바꾸듯, AI가 새로운 작업과 환경에 동적으로 적응할 수 있도록 설계되었습니다.

  • 확장 가능성: 하나의 작업에 학습된 z-벡터를 다른 작업에 재사용하거나 결합 가능.
  • 지속 학습: 테스트 중에도 변화에 대응하며 끊임없이 진화.

💻 트랜스포머²의 실용적 활용과 미래

사카나 AI는 이번 연구를 통해 AI 모델이 더 이상 정적인 시스템에 머물지 않고, “살아있는 지능(Living Intelligence)”으로 진화할 가능성을 보여줬습니다.

  • 코드 공개: 현재 트랜스포머²의 코드는 깃허브에서 다운로드할 수 있으며, 연구자와 개발자들이 이를 실험적으로 활용할 수 있습니다.

🧩 결론: 적응형 AI가 열어갈 새로운 시대

트랜스포머²는 LLM의 실행 비용을 줄이고 성능을 극대화할 수 있는 가능성을 제시합니다. 이는 AI가 단순한 정적 모델에서 벗어나, 환경 변화에 적응하며 지속적으로 학습할 수 있는 동적 시스템으로 전환되는 미래를 상징합니다.

사카나 AI의 이 기술은 수학, 코딩, 시각적 이해 등 다양한 작업에 적용 가능하며, AI의 효율성과 응용 범위를 새롭게 정의할 것입니다.

첨부 이미지

이 뉴스레터의 모든 콘텐츠(텍스트, 이미지, 디자인 등)는 저작권법의 보호를 받습니다.

뉴스레터 발행자의 승인 없이 무단 복제, 배포, 수정, 전재, 또는 상업적 이용을 금합니다.개인적인 참고나 공유를 위해 사용하실 경우, 원본 링크를 명확히 표시해 주시기 바랍니다.

Copyright NoticeAll content in this newsletter (text, images, design, etc.) is protected under copyright law. Unauthorized reproduction, distribution, modification, retransmission, or commercial use without the publisher's consent is strictly prohibited.For personal reference or sharing, please clearly attribute the original source.

 

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

✉️

이번 뉴스레터 어떠셨나요?

Tomorrow Tech 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글

의견을 남겨주세요

확인
의견이 있으신가요? 제일 먼저 댓글을 달아보세요 !
© 2025 Tomorrow Tech

통찰력 있는 최신 기술 트렌드와 깊이 있는 분석.

메일리 로고

도움말 자주 묻는 질문 오류 및 기능 관련 제보 뉴스레터 광고 문의

서비스 이용 문의admin@team.maily.so

메일리 사업자 정보

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울 서초구 강남대로53길 8, 8층 11-7호

이용약관 | 개인정보처리방침 | 정기결제 이용약관 | 라이선스