Bittensor의 SN3, 1조 개의 파라미터 학습 실행에 네트워크의 사활을 걸다

2026년 4월 22일 · 약 11 분

Software Engineer

2026년 3월, 가정용 인터넷 연결을 사용하는 수십 명의 익명 채굴자들이 메타(Meta)의 Llama 2 70B에 육박하는 성능을 기록한 720억 개의 파라미터를 가진 언어 모델을 학습시켰습니다. 6주 후, 이 노력을 주도했던 팀은 떠났고, 1,000만 달러 상당의 TAO를 매각하며 비텐서(Bittensor)의 탈중앙화는 "쇼(theatre)"라고 비난했습니다. 이제 남겨진 커뮤니티는 그 규모를 14배 키워 약 4주 만에 다시 도전하려 합니다. 탈중앙화 AI라는 가설 전체의 운명이 이 결과에 달려 있습니다.

이것은 비텐서의 서브넷 3(최근 코버넌트 AI(Covenant AI)의 이탈 이후 Teutonic으로 브랜드를 변경함)이 그레이스케일(Grayscale)의 TAO ETF SEC 검토 기간에 맞춰 1조 개의 파라미터 학습 실행을 어떻게 결심하게 되었는지에 대한 이야기입니다. 이는 프로토콜의 인센티브 레이어가 이를 구축한 사람들보다 더 중요하다는 도박이며, 거버넌스 위기에서 살아남은 바로 그 네트워크가 규제 당국이 월스트리트의 진입 허용 여부를 결정하기 전에 탈중앙화 AI의 "DeepSeek 모먼트"를 만들어낼 수 있다는 베팅입니다.

72B 모델이 어떻게 허가 없는 AI의 기준점이 되었는가

이야기는 2026년 3월 10일, 당시 Templar라는 이름으로 운영되던 서브넷 3가 Covenant-72B를 발표하며 시작됩니다. 이 모델은 공용 인터넷을 통해 협력하는 70명 이상의 독립적인 채굴자들이 약 1.1조 개의 토큰으로 학습시킨 720억 개의 파라미터를 가진 모델입니다. 이는 지금까지 완료된 탈중앙화 LLM 사전 학습 실행 중 압도적으로 가장 큰 규모였습니다.

중요한 벤치마크는 67.1의 MMLU 점수였습니다. 이는 Covenant-72B를 세계에서 가장 자본력이 풍부한 AI 연구소 중 하나가 제작한 메타의 Llama 2 70B와 대등한 위치에 올려놓았습니다. NVIDIA의 CEO 젠슨 황(Jensen Huang)은 이 시도를 "AI를 위한 현대판 folding@home"이라고 공개적으로 비유했습니다. Templar의 서브넷 토큰은 급등했고, 정점에서의 시장 가치는 15억 달러를 넘어섰습니다.

기술적 돌파구는 모델 아키텍처가 아니라 협업 레이어에 있었습니다. 두 가지 요소가 핵심적인 역할을 했습니다:

SparseLoCo: 희소화(Sparsification), 2비트 양자화, 오류 피드백을 통해 노드 간 대역폭 요구 사항을 146배 줄인 통신 효율적 학습 알고리즘입니다. 이것이 없었다면 일반 가정용 인터넷에서 프런티어 규모의 학습 실행은 물리적으로 불가능했을 것입니다. 그래디언트 동기화만으로도 모든 채굴자의 연결이 포화 상태가 되었을 것이기 때문입니다.
Gauntlet: 손실 평가(Loss evaluation)와 OpenSkill 순위를 통해 각 채굴자의 기여도를 점수화하는 비텐서의 블록체인 검증 인센티브 시스템입니다. 우수한 노드에는 TAO를 지급하고 나머지는 슬래싱(Slashing)합니다.

이들은 암호학적 인센티브를 통해서만 협력하는 익명의 기여자들로 구성된 허가 없는(Permissionless) 네트워크가 수십억 달러 규모의 연구소 결과물과 경쟁할 수 있는 모델을 학습시키는, 진정으로 새로운 무언가를 만들어냈습니다.

그러다 문제가 터졌습니다.

코버넌트의 이탈: 12시간 만에 증발한 9억 달러

2026년 4월 10일, 비텐서에서 가장 가치 있는 세 개의 서브넷(SN3 Templar, SN39 Basilica, SN81 Grail)을 운영하던 팀인 코버넌트 AI(Covenant AI)의 설립자 샘 데어(Sam Dare)가 탈퇴를 선언했습니다. 몇 시간 만에 그는 약 1,020만 달러 규모인 37,000 TAO를 매각했고, 공동 설립자인 제이콥 스티브스("Const")가 프로토콜에 대해 중앙 집중식 통제권을 행사하고 있으며 비텐서의 탈중앙화는 아키텍처가 아니라 연기에 불과하다는 비난을 남기고 떠났습니다.

시장 반응은 즉각적이었습니다. TAO는 측정 기간에 따라 20–28% 폭락하며 12시간 만에 약 6억 5,000만–9억 달러의 시가총액이 증발했습니다. 서브넷 알파 토큰의 상황은 더 심각했습니다. Grail(SN81)은 저점에서 67% 하락했습니다. 약 1,000만 달러 규모의 롱 포지션이 청산되었습니다.

두 가지 사실이 공포를 완화했습니다:

서브넷은 죽지 않았습니다. 커뮤니티 채굴자들은 중앙 운영자 없이 오픈 소스 코드를 통해 SN3, SN39, SN81을 재가동했습니다. 코버넌트가 구축한 인프라는 실제로 공개된 결과물들로부터 복구가 가능했으며, 이는 역설적으로 데어가 부인했던 탈중앙화 가설을 증명하는 셈이 되었습니다.
TAO 공급량의 70%가 스테이킹된 상태를 유지했습니다. 장기 보유자들은 데어를 따라 시장을 떠나지 않았습니다.

하지만 네트워크에는 신뢰성 문제가 남았습니다. 비텐서의 주요 기술적 성과를 달성한 팀인 코버넌트가 정점에서 떠나 토큰 가격을 폭락시킬 수 있다면, 다음 서브넷 운영자가 똑같은 행동을 하지 않으리라는 보장이 어디 있겠습니까?

확신 메커니즘: 떠날 수 있는 사람들을 붙잡아두기

Const의 답변은 데어가 떠난 지 열흘 뒤인 2026년 4월 20일에 나왔습니다. **확신 메커니즘(Conviction Mechanism)**으로 명명된 BIT-0011은 서브넷 소유자가 투표권 및 서브넷 소유권에 매칭되는 "확신 점수(Conviction score)"를 대가로 TAO를 몇 달 또는 몇 년 동안 타임락(Time-lock)하도록 강제하는 락업 스테이킹(Locked Stake) 체제를 제안합니다.

메커니즘의 세부 사항:

확신 점수는 100%에서 시작하여, 토큰이 락업에 보충되지 않으면 30일 간격으로 감소합니다.
투표권과 소유권은 이 감소 수치와 연동되어 줄어들며, 갑작스러운 자본 유출은 단순한 도덕적 비난을 넘어 경제적으로 큰 비용을 치르게 만듭니다.
이 시스템은 코버넌트가 운영했던 바로 그 세 서브넷인 SN3, SN39, SN81과 같은 성숙한 서브넷을 우선 대상으로 합니다.

뼈아픈 농담 같은 사실은, BIT-0011이 샘 데어가 떠나기 전 본인이 직접 초안을 작성한 것으로 알려졌다는 점입니다. 떠난 설립자가 설립자들의 이탈을 방지하기 위해 설계된 규칙을 쓴 것입니다.

이 제안은 서브넷 운영자가 거버넌스 제재 없이 포지션을 덤핑할 수 있었던 실질적인 구조적 약점을 해결하지만, 장기 락업 투자자들에게 권력을 집중시킨다는 또 다른 형태의 중앙 집중화를 초래하기도 합니다. 이것이 적절한 트레이드오프인지 여부는 비텐서의 주요 위험이 설립자의 배신인지, 아니면 소수 과점 세력에 의한 장악인지에 대한 판단에 달려 있습니다.

Teutonic과 1조 개 파라미터로 향한 대담한 도전

이러한 배경 속에서, 브랜드 이름을 변경한 Teutonic 서브넷 (SN3, 구 Templar)은 2026년 5월 중순에서 하순 사이를 목표로 1조 개 파라미터 (1-trillion-parameter) 규모의 탈중앙화 학습 실행을 공개적으로 약속했습니다. 이는 Covenant-72B의 약 14배에 달하는 규모로, 동일한 기본 아키텍처를 사용하지만 기존 Covenant 엔지니어가 아닌 커뮤니티가 복구한 팀에 의해 진행됩니다.

이러한 전략적 타이밍은 결코 우연이 아닙니다. 그레이스케일 (Grayscale)은 2026년 4월 2일, NYSE Arca에 현물 비텐서 트러스트 ETF (제안된 티커 GTAO)에 대한 S-1 수정안을 제출했습니다. 현재 SEC의 결정 창구는 2026년 8월로 추적되고 있습니다. 5월에 1조 개 파라미터 학습이 성공적으로 수행된다면, 규제 당국의 심의가 정점에 달할 시기에 맞춰 "이것이 실제 기술인가, 아니면 밈(meme)에 불과한가?"라는 핵심적인 질문에 답을 제시하게 될 것입니다. 그레이스케일은 이미 4월 7일, 광범위한 AI 펀드 내에서 TAO의 비중을 **43.06%**로 상향 조정했으며, 이는 해당 펀드가 실시한 단일 자산 재배분 중 최대 규모입니다.

낙관적인 시나리오(Bull case)는 명확합니다. 신뢰할 수 있는 1조 개 파라미터 규모의 탈중앙화 모델을 출시하여, ETF 승인이 기관 자금 유입을 정당화하는 데 필요한 "딥시크(DeepSeek) 모멘텀"을 만들고, 한 분기 만에 탈중앙화 AI 카테고리 전체의 가치를 재평가하는 것입니다.

반면 비관적인 시나리오(Bear case)는 마케팅이 아닌 엔지니어링 측면에서 발생합니다.

프런티어 랩도 겪어보지 못한 탈중앙화 학습 확장의 난제

GPT-5, Claude 4.7 Opus, Gemini 2.5 Ultra와 같은 중앙 집중식 1조 개 이상의 파라미터 모델은 NVLink 및 InfiniBand와 같은 특수 목적 패브릭을 통해 모든 GPU가 서로 연결된 시설 내에서 학습됩니다. 이들은 마이크로초 미만의 지연 시간과 초당 테라비트급 대역폭을 갖추고 있습니다. 그런 조건에서도 그래디언트 동기화(gradient synchronization)는 병목 현상이 됩니다. 발표된 연구들에 따르면, 확장이 미숙할 경우 LLM 학습 시간의 90% 이상이 연산이 아닌 통신에 소비될 수 있습니다.

Teutonic의 마이너(Miner)들은 주거용 인터넷의 약 100ms WAN 지연 시간 환경에서 협업하고 있습니다. Covenant-72B가 가능했던 유일한 이유는 SparseLoCo가 통신량을 146배 압축했기 때문입니다. 하지만 파라미터를 1조 개로 늘리면 다음과 같은 세 가지 까다로운 문제가 발생합니다:

그래디언트 크기는 파라미터 수에 따라 대략 선형적으로 증가합니다. 모델 규모가 14배 커진다는 것은 옵티마이저 상태(optimizer state)를 고려하기 전이라도 각 단계마다 동기화해야 할 데이터가 14배 많아짐을 의미합니다.
노드 간 조율 오버헤드는 역사적으로 작업자 수에 따라 초선형적(super-linearly)으로 증가합니다. Teutonic이 노드 풀을 약 70개에서 256개로 두 배 이상 늘린다면, All-reduce 통신 비용은 단순히 두 배가 되는 것이 아니라 토폴로지에 따라 4~10배까지 늘어날 수 있습니다.
장애 모드가 복합적으로 작용합니다. 70개 노드 네트워크에서 한 노드가 학습 도중 탈락하는 것은 작은 슬래싱(slashing) 이벤트에 불과합니다. 하지만 14배 더 큰 그래디언트를 처리하는 256개 노드 네트워크에서는 동일한 탈락이 학습 라운드 전체를 중단시킬 수 있습니다.

이 중 해결 불가능한 것은 없습니다. 이 기종 저대역폭 사전 학습, FusionLLM, 통신-연산 중첩, 지연된 그래디언트 보상 등 이 체제를 겨냥한 수많은 탈중앙화 학습 연구가 존재합니다. 그러나 이러한 연구의 대부분은 70억(7B)~700억(70B) 파라미터 규모에서 검증되었습니다. 지리적으로 분산된 범용 하드웨어에서 1조 개 파라미터 학습을 실행하는 것은 단순한 제품 출시를 넘어 그 자체로 독보적인 연구 성과가 될 것입니다.

솔직한 평가는 이렇습니다: Teutonic은 마케팅 수준의 마감 기한을 가지고 연구 수준의 엔지니어링 과제에 도전하고 있습니다. 성공한다면 전체 dTAO 생태계에 필요한 신뢰 구축 이벤트가 되겠지만, 실패한다면 SEC의 가장 면밀한 검토 기간 동안 공개적으로 좌초될 위험이 있습니다.

Teutonic이 생존해야 할 탈중앙화 AI 학습 지형

2026년에 "신뢰할 수 있는 탈중앙화 1조 개 파라미터" 이정표를 차지하려는 프로젝트는 Teutonic만이 아닙니다. 경쟁 지도는 빠르게 채워지고 있습니다:

Gensyn은 이 기사가 나가는 날인 2026년 4월 22일에 메인넷을 출시했습니다. 출시와 함께 AI 기반 컴퓨팅 작업 매칭 레이어인 Delphi Markets와 파트너십을 맺었습니다. 출시 당일 종료 시점에 Gensyn은 5,000대 이상의 NVIDIA H100에 해당하는 해시레이트를 보고했습니다. 비텐서가 허가 없는 조율과 토큰 인센티브 플라이휠을 판매한다면, Gensyn은 올바른 실행에 대한 암호학적 증명을 갖춘 검증 가능한 AI 컴퓨팅 마켓플레이스로 포지셔닝하고 있습니다.
Ritual은 반대 방향으로 나아가 **학습보다는 추론(inference)**에 집중하고 있습니다. 이들의 Infernet 기술을 사용하면 어떤 스마트 컨트랙트든 AI 출력을 요청하고, 지정된 모델이 수정 없이 사용되었다는 암호학적 증명을 받을 수 있습니다. 이는 "바닥부터 프런티어 모델을 학습시키는" 논리가 아닌 "DeFi 내에서 검증 가능한 AI"를 구현하려는 논리입니다.
Ambient와 Origins Network 또한 인센티브 구조와 검증 전략은 다르지만, 프런티어 학습에 대한 중앙화된 랩의 독점을 깨겠다는 유사한 장기적 목표를 가지고 인접한 베팅을 하고 있습니다.

이 프로젝트들이 모두 동일한 이정표를 두고 직접 경쟁하는 것은 아니지만, 한정된 관심과 자본을 두고 경쟁하고 있습니다. 만약 Gensyn의 메인넷이 상업적 워크로드를 통해 "탈중앙화 AI의 시대가 왔다"는 서사를 선점한다면, Teutonic의 5월 학습 실행은 비텐서 특유의 방식(서브넷 경쟁과 토큰 가중치 인센티브)이 올바른 아키텍처인지, 아니면 추월당할 첫 번째 반복 단계인지를 판가름하는 시험대가 될 것입니다.

TAO 그 이상의 의미를 갖는 이유

향후 4 ~ 6주 동안 세 가지 요소가 동시에 시험대에 오르게 됩니다:

탈중앙화 학습의 확장성 여부. Teutonic이 성공한다면, "탈중앙화 AI 연산의 비트코인"이라는 가설은 살아남을 것입니다. 실패할 경우, Covenant의 이탈은 서브넷 기반 학습이 정점을 찍은 순간 — 즉, 72B가 토대가 아닌 72B라는 한계치로 기록되는 순간 — 으로 해석될 것입니다.

Conviction Mechanism(확신 메커니즘)이 적절한 거버넌스 해결책인지 여부. 서브넷 운영자를 락업(Locking)하면 Covenant 방식의 덤핑은 방지할 수 있지만, 장기 스테이커들이 기득권화되는 새로운 실패 모드가 발생할 수 있습니다. 비트코인 코어의 분산 유지 관리 모델, 솔라나 랩스의 지속적인 중앙 집중식 핵심 개발, 그리고 수이(Sui)의 Mysten Labs 집중화는 모두 동일한 질문에 대한 서로 다른 세 가지 답변입니다. 즉, 프로토콜의 복잡성으로 인해 커뮤니티가 신뢰해야 할 강력한 중앙 유지 관리자가 필요한가에 대한 질문입니다. 비텐서(Bittensor)는 현재 실시간으로 이 실험의 자체 버전을 진행하고 있습니다.

ETF 승인 시점이 탈중앙화 AI로 하여금 전통 금융(TradFi)의 일정에 맞춰 결과물을 내놓게 강제하는지 여부. SEC의 8월 결정 시한은 "흥미로운 연구 프로젝트"가 아닌 "DeepSeek 모멘트"가 되고자 하는 서사에 있어 엄격한 마감 기한입니다. 이는 무엇이 출시되느냐에 따라 건강한 추진력이 될 수도, 과도한 약속의 원인이 될 수도 있습니다.

인프라 측면에서 지켜보는 빌더들에게 근본적인 신호는 더 명확합니다: AI 에이전트와 탈중앙화 학습 네트워크는 새로운 차원의 온체인 쿼리 부하를 생성하려 하고 있습니다 — 모델 레지스트리 조회, 증명(attestation) 검증, 그래디언트 체크포인트 해시, 서브넷 성능 데이터 등 — 이는 기존 RPC 인프라가 설계된 방식인 사용자 중심의 DApp 패턴과는 맞지 않습니다.

BlockEden.xyz는 AI와 크립토 스택을 결합하는 팀을 위해 27개 이상의 체인에서 엔터프라이즈급 RPC 및 인덱싱 인프라를 제공합니다. API 마켓플레이스 둘러보기를 통해 인간과 기계 트래픽 모두를 위해 설계된 레일 위에서 빌드해 보세요.

출처

Share on Twitter

API Marketplace Featured

72B 모델이 어떻게 허가 없는 AI의 기준점이 되었는가​

코버넌트의 이탈: 12시간 만에 증발한 9억 달러​

확신 메커니즘: 떠날 수 있는 사람들을 붙잡아두기​

Teutonic과 1조 개 파라미터로 향한 대담한 도전​

프런티어 랩도 겪어보지 못한 탈중앙화 학습 확장의 난제​

Teutonic이 생존해야 할 탈중앙화 AI 학습 지형​

TAO 그 이상의 의미를 갖는 이유​

출처​