스타트업, Mythos·Fable에 필적하는 새 모델 공개 주장

일본계 AI 스타트업 Sakana AI가 "Fugu"라는 이름의 새 모델을 발표하며 OpenAI의 Mythos, Anthropic의 Fable에 필적하는 성능을 갖췄다고 주장해 업계의 이목을 끌고 있습니다. 거대 자본과 수천 명의 엔지니어가 아닌, 소규모 팀과 혁신적인 방법론으로 이 주장이 사실이라면 AI 개발 패러다임이 바뀔 수 있다는 기대가 나옵니다.

Fugu가 뭔가

Fugu는 Sakana AI가 개발한 모델로, 이름은 일본 복어(フグ)에서 따왔습니다. Sakana AI는 자연에서 영감을 받은 AI 연구로 알려진 회사로, 진화 알고리즘과 모델 병합(Model Merging) 기법에 집중해왔습니다.

Fugu는 단일한 대규모 모델이 아니라 여러 오픈소스 모델을 조합하는 방식으로 만들어졌습니다. 수십억 달러의 GPU 클러스터로 처음부터 학습한 것이 아니라, 이미 공개된 모델들의 강점을 선택적으로 결합해 시너지를 내는 접근법입니다. 이를 "신경 다윈주의(Neural Darwinism)" 방식이라고 부르기도 합니다.

어떤 방식으로 만들었나

Sakana AI가 공개한 기술 보고서에 따르면 Fugu는 다음과 같은 단계로 개발됐습니다.

모델 풀 선정: 수학, 코드, 추론, 언어 이해 등 분야별로 강점을 가진 오픈소스 모델 12개를 선별했습니다.
진화적 탐색: 각 모델의 레이어와 가중치를 어떻게 조합할지를 진화 알고리즘으로 탐색합니다.
병합 최적화: 선택된 조합을 작은 데이터셋으로 미세 조정(Fine-tuning)합니다.
반복 검증: 벤치마크 성능을 기준으로 최적 조합을 반복 선택합니다.

이 방식의 장점은 막대한 사전 학습 비용 없이도 빠르게 고성능 모델을 만들 수 있다는 점입니다. 전통적인 대형 모델 학습에는 수천만 달러가 필요하지만, Fugu 방식은 그 비용의 1% 미만으로 경쟁력 있는 모델을 만들 수 있다고 Sakana AI는 주장합니다.

실제로 검증됐나

Sakana AI는 MMLU, HumanEval, MATH 등 주요 벤치마크에서 Fugu가 Mythos급 성능을 보인다고 발표했습니다. 그러나 외부 독립 기관의 검증은 아직 이루어지지 않았습니다. AI 업계에서는 자체 발표 벤치마크의 신뢰도에 대한 의구심이 크기 때문에, 제3자 평가가 이루어지기 전까지는 주장을 그대로 받아들이기 어렵습니다.

특히 벤치마크 오염(contamination) 문제, 즉 테스트 데이터가 학습 과정에 포함됐을 가능성도 배제하기 어렵습니다. Mythos나 Fable처럼 거대 기업이 수년간 검증한 모델과 단순 수치로 비교하는 것 자체가 무리가 있다는 시각도 있습니다.

그럼에도 불구하고 모델 병합 방식은 학계에서도 주목하는 기법으로, 실제로 일부 태스크에서 인상적인 결과를 보여주고 있습니다. Fugu가 주장대로 범용적으로 뛰어나다면, 소규모 팀도 프런티어 모델을 만들 수 있다는 증거가 됩니다.

📌 딸깍 한 줄 요약: 거대 자본 없이 작은 팀이 만든 모델이 정말 Mythos를 따라잡을 수 있는지 아직 미지수입니다.

딸

딸깍이

어려운 AI를 쉽게 전하는 사람. AI 뉴스, 생성형 AI 활용법, 실전 자동화 팁을 매주 뉴스레터로 보내드립니다.

딸깍AI 뉴스레터를 구독하세요

매주 꼭 알아야 할 AI 소식만 골라 이메일로 보내드립니다. 스팸 없음 · 무료

Fugu가 뭔가

어떤 방식으로 만들었나

실제로 검증됐나

AI 뉴스,놓치지 마세요

AI 뉴스,
놓치지 마세요