탈중앙화 AI 추론 시장: Bittensor, Gensyn, Cuckoo AI
소개
탈중앙화 AI 추론/훈련 시장은 신뢰가 필요 없는(trustless) 방식으로 전 세계 컴퓨팅 리소스와 커뮤니티 모델을 활용하는 것을 목표로 합니다. Bittensor, Gensyn, **Cuckoo Network (Cuckoo AI)**와 같은 프로젝트들은 블록체인 기술이 어떻게 개방형 AI 마켓플레이스를 구동할 수 있는지 보여줍니다. 각 플랫폼은 컴퓨팅 파워, 머신러닝 모델, 그리고 때로는 데이터와 같은 핵심 AI 자산을 온체인 경제 단위로 토큰화합니다. 다음에서는 이러한 네트워크를 뒷받침하는 기술 아키텍처, 리소스 토큰화 방식, 거버넌스 및 인센티브 구조, 모델 소유권 추적 방법, 수익 공유 메커니즘, 그리고 발생하는 공격 표면(예: 시빌 공격, 담합, 무임승차, 포이즈닝)에 대해 자세히 살펴보겠습니다. 마지막 비교표는 Bittensor, Gensyn, Cuckoo AI의 모든 핵심 차원을 요약합니다.
기술 아키텍처
Bittensor: 서브넷 기반의 탈중 앙화 "신경 인터넷"
Bittensor는 다수의 특화된 서브넷에 걸쳐 AI 모델 노드 네트워크를 조정하는 맞춤형 레이어 1 블록체인(Subtensor 체인, Substrate 기반) 위에 구축되었습니다. 각 서브넷은 특정 AI 작업(예: 언어 생성을 위한 서브넷, 이미지 생성을 위한 또 다른 서브넷 등)에 초점을 맞춘 독립적인 미니 네트워크입니다. Bittensor의 참여자들은 다음과 같은 뚜렷한 역할을 맡습니다:
- 채굴자(Miners) – 자신의 하드웨어에서 머신러닝 모델을 실행하고 서브넷의 작업에 대한 추론 답변을 제공하거나 훈련을 수행합니다. 본질적으로 채굴자는 쿼리에 응답할 AI 모델을 호스팅하는 노드입니다.
- 검증자(Validators) – 프롬프트로 채굴자의 모델에 쿼리하고 응답의 품질을 평가하여 어떤 채굴자가 가치 있는 결과를 기여하는지에 대한 의견을 형성합니다. 검증자는 효과적으로 채굴자의 성능을 채점합니다.
- 서브넷 소유자(Subnet Owners) – 서브넷을 생성하고 정의하며, 해당 서브넷에서 어떤 작업이 수행되고 검증이 어떻게 이루어지는지에 대한 규칙을 설정합니다. 예를 들어, 서브넷 소유자는 특정 데이터셋이나 모달리티를 위한 서브넷을 지정하고 검증 절차를 정의할 수 있습니다.
- 위임자(Delegators) – 노드를 운영하지 않는 토큰 보유자는 자신의 Bittensor 토큰(TAO)을 채굴자나 검증자에게 위임(스테이킹)하여 최고의 성과자를 지원하고 보상의 일부를 얻을 수 있습니다(지분 증명 네트워크의 스테이킹과 유사).
Bittensor의 합의 메커니즘은 참신합니다. 전통적인 블록 검증 대신, Bittensor는 "지능 증명(proof-of-intelligence)"의 한 형태인 유마(Yuma) 합의를 사용합니다. 유마 합의에서 채굴자에 대한 검증자의 평가는 온체인에서 집계되어 보상 분배를 결정합니다. 12초마다 생성되는 블록에서 네트워크는 새로운 TAO 토큰을 발행하고, 어떤 채굴자가 유용한 작업을 제공했는지에 대한 검증자들의 합의에 따라 분배합니다. 검증자의 점수는 지분 가중 중앙값 방식으로 결합됩니다. 즉, 특이한 의견은 잘리고 정직한 다수의 의견이 우세하게 됩니다. 이는 대부분의 검증자가 한 채굴자가 고품질이라고 동의하면 해당 채굴자는 높은 보상을 받고, 한 검증자가 다른 검증자들과 크게 다른 의견을 내면(담합이나 오류 가능성) 해당 검증자는 보상을 덜 받음으로써 불이익을 받는다는 것을 의미합니다. 이런 방식으로 Bittensor의 블록체인은 채굴자-검증자 피드백 루프를 조정합니다. 채굴자들은 최고의 AI 결과물을 생성하기 위해 경쟁하고, 검증자들은 그 결과물을 큐레이팅하고 순위를 매기며, 양측 모두 자신이 추가한 가치에 비례하여 토큰을 얻습니다. 이 아키텍처는 종종 "탈중앙화 신경망" 또는 "글로벌 브레인"으로 묘사되며, 모델들이 서로의 신호로부터 배우고 집단적으로 진화합니다. 특히, Bittensor는 최근 체인을 업그레이드하여 EVM 호환성(스마트 계약용)을 지원하고, 리소스 할당에 대한 통제를 더욱 분산시키기 위해 서브넷별 토큰 및 스테이킹 시스템인 dTAO를 도입했습니다.
Gensyn: 신뢰가 필요 없는 분산 컴퓨팅 프로토콜
Gensyn은 머신러닝을 위한 분산 컴퓨팅 프로토콜의 관점에서 탈중앙화 AI에 접근합니다. 이 아키텍처는 AI 작업(모델 훈련이나 추론 작업 실행 등)을 가진 **개발자(제출자)**와 전 세계의 여유 GPU/TPU 리소스를 가진 **컴퓨팅 제공자(해결자)**를 연결합니다. 원래 Gensyn은 Substrate L1 체인을 계획했지만, 더 강력한 보안과 유동성을 위해 이더리움 롤업으로 구축하는 방향으로 전환했습니다. 따라서 Gensyn 네트워크는 이더리움 레이어 2(이더리움 롤업)로서 작업 게시와 결제를 조정하고, 계산은 제공자의 하드웨어에서 오프체인으로 이루어집니다.
Gensyn 설계의 핵심 혁신은 오프체인 작업에 대한 검증 시스템입니다. Gensyn은 **낙관적 검증(사기 증명)**과 암호화 기술을 조합하여 해결자가 훈련/추론 작업을 실행했다고 주장할 때 그 결과가 정확함을 보장합니다. 실제로 프로토콜에는 여러 참여자 역할이 포함됩니다:
- 제출자(Submitter) – 작업을 요청하는 당사자(예: 모델 훈련이 필요한 사람). 네트워크 수수료를 지불하고 모델/데이터 또는 작업 사양을 제공합니다.
- 해결자(Solver) – ML 작업에 입찰하고 자신의 하드웨어에서 실행하는 노드. 요청에 따라 모델을 훈련하거나 추론을 실행한 다음, 결과와 계산 증명을 제출합니다.
- 검증자/도전자(Verifier/Challenger) – 해결자의 작업을 감사하거나 무작위로 점검할 수 있는 노드. Gensyn은 Truebit 스타일의 방식을 구현하여 기본적으로 해결자의 결과는 수락되지만, 부정확한 계산이 의심되는 경우 검증자가 일정 기간 내에 이의를 제기할 수 있습니다. 이의 제기가 발생하면, 계산 단계를 통한 대화형 "이진 탐색"(사기 증명 프로토콜)을 사용하여 불일치 지점을 정확히 찾아냅니다. 이를 통해 체인은 전체적인 비싼 작업을 다시 수행하는 대신, 최소한의 중요한 계산 부분만 온체인에서 수행하여 분쟁을 해결할 수 있습니다.
결정적으로, Gensyn은 순진한 접근 방식의 막대한 중복성을 피하도록 설계되었습니다. 많은 노드가 모두 동일한 ML 작업을 반복하는 대신(이는 비용 절감 효과를 없앨 것임), Gensyn의 "학습 증명(proof-of-learning)" 접근 방식은 훈련 메타데이터를 사용하여 학습 진행이 이루어졌음을 검증합니다. 예를 들어, 해결자는 중간 모델 가중치의 암호화 해시나 체크포인트, 그리고 이것이 훈련 업데이트에 따라 진행되었음을 보여주는 간결한 증명을 제공할 수 있습니다. 이 확률적 학습 증명은 전체 훈련을 다시 실행하는 것보다 훨씬 저렴하게 확인할 수 있어, 완전한 복제 없이 신뢰가 필요 없는 검증을 가능하게 합니다. 검증자가 이상을 감지한 경우에만 최후의 수단으로 더 무거운 온체인 계산이 트리거됩니다. 이 접근 방식은 무차별 대입 검증에 비해 오버헤드를 극적으로 줄여 탈중앙화 ML 훈련을 더 실현 가능하게 만듭니다. 따라서 Gensyn의 아키텍처는 암호경제학적 게임 설계를 크게 강조합니다. 해결자는 지분이나 보증금을 걸고, 만약 속임수(잘못된 결과 제출)를 쓰면 정직하게 잡아낸 검증자에게 그 지분을 잃게 됩니다. 블록체인 조정(결제 및 분쟁 해결용)과 오프체인 컴퓨팅 및 영리한 검증을 결합함으로써, Gensyn은 신뢰성을 유지하면서 어디서든 유휴 GPU를 활용할 수 있는 ML 컴퓨팅 마켓플레이스를 만듭니다. 그 결과, 모든 개발자가 저렴하고 전 세계적으로 분산된 훈련 성능을 필요에 따라 이용할 수 있는 하이퍼스케일 "컴퓨팅 프로토콜"이 탄생합니다.
Cuckoo AI: 풀스택 탈중앙화 AI 서비스 플랫폼
Cuckoo Network(또는 Cuckoo AI)는 보다 수직적으로 통합된 접근 방식을 취하여, 단순히 원시 컴퓨팅이 아닌 엔드투엔드 탈중앙화 AI 서비스를 제공하는 것을 목표로 합니다. Cuckoo는 모든 것을 조율하기 위해 자체 블록체인(초기에는 Arbitrum Orbit, 즉 이더리움 호환 롤업 프레임워크 위의 Cuckoo Chain이라는 레이어 1)을 구축했습니다. 이는 작업과 GPU를 매칭할 뿐만 아니라, AI 애플리케이션을 호스팅하고 단일 시스템 내에서 결제를 처리합니다. 이 설계는 풀스택입니다. 즉, 거래와 거버넌스를 위한 블록체인, 탈중앙화 GPU/CPU 리소스 레이어, 그리고 그 위에 사용자 대상 AI 애플리케이션과 API를 결합합니다. 다시 말해, Cuckoo는 블록체 인, 컴퓨팅, AI 애플리케이션이라는 세 가지 레이어를 단일 플랫폼 내에 통합합니다.
Cuckoo의 참여자는 네 그룹으로 나뉩니다:
- AI 앱 빌더(코디네이터) – Cuckoo에 AI 모델이나 서비스를 배포하는 개발자들입니다. 예를 들어, 개발자는 Stable Diffusion 이미지 생성기나 LLM 챗봇을 서비스로 호스팅할 수 있습니다. 이들은 코디네이터 노드를 운영하며, 자신의 서비스를 관리하는 책임을 집니다. 즉, 사용자 요청을 수락하고, 이를 작업으로 분할하여 채굴자에게 할당합니다. 코디네이터는 네이티브 토큰($CAI)을 스테이킹하여 네트워크에 참여하고 채굴자를 활용할 권리를 얻습니다. 이들은 본질적으로 사용자와 GPU 제공자 사이를 연결하는 레이어 2 오케스트레이터 역할을 합니다.
- GPU/CPU 채굴자(작업 노드) – 리소스 제공자입니다. 채굴자들은 Cuckoo 작업 클라이언트를 실행하고 자신의 하드웨어를 기여하여 AI 앱을 위한 추론 작업을 수행합니다. 예를 들어, 채굴자는 코디네이터로부터 이미지 생성 요청(주어진 모델과 프롬프트 포함)을 할당받아 자신의 GPU를 사용하여 결과를 계산할 수 있습니다. 채굴자 또한 약속과 선량한 행동을 보장하기 위해 $CAI를 스테이킹해야 합니다. 이들은 올바르게 완료한 각 작업에 대해 토큰 보상을 받습니다.
- 최종 사용자 – AI 애플리케이션의 소비자입니다. 이들은 Cuckoo의 웹 포털이나 API를 통해 상호작용합니다(예: CooVerse를 통해 예술 작품 생성 또는 AI 인격체와 대화). 사용자는 각 사용에 대해 암호화폐로 지불하거나, 사용 비용을 상쇄하기 위해 자신의 컴퓨팅을 기여(또는 스테이킹)할 수 있습니다. 중요한 측면은 검열 저항성입니다. 한 코디네이터(서비스 제공자)가 차단되거나 다운되면, 사용자는 동일한 애플리케이션을 제공하는 다른 코디네이터로 전환할 수 있습니다. 왜냐하면 탈중앙화 네트워크에서는 여러 코디네이터가 유사한 모델을 호스팅할 수 있기 때문입니다.
- 스테이커(위임자) – AI 서비스나 채굴 하드웨어를 운영하지 않는 커뮤니티 구성원도 이를 운영하는 사람들에게 $CAI를 스테이킹함으로써 참여할 수 있습니다. 신뢰할 수 있는 코디네이터나 채굴자에게 자신의 지분으로 투표함으로써, 이들은 평판을 알리는 데 도움을 주고 그 대가로 네트워크 보상의 일부를 얻습니다. 이 설계는 Web3 평판 레이어를 구축합니다. 선량한 행위자는 더 많은 지분(따라서 신뢰와 보상)을 유치하고, 악의적인 행위자는 지분과 평판을 잃습니다. 어떤 경우에는 최종 사용자도 스테이킹하여 네트워크의 성공에 동참할 수 있습니다.
Cuckoo 체인(현재 독립형 체인에서 공유 보안 롤업으로 전환 중)은 이러한 모든 상호작용을 추적합니다. 사용자가 AI 서비스를 호출하면, 코디네이터 노드는 채굴자를 위한 온체인 작업 할당을 생성합니다. 채굴자들은 오프체인에서 작업을 실행하고 결과를 코디네이터에게 반환하며, 코디네이터는 이를 검증(예: 출력 이미지나 텍스트가 무의미하지 않은지 확인)하고 최종 결과를 사용자에게 전달합니다. 블록체인은 결제 정산을 처리합니다. 각 작업에 대해 코디네이터의 스마트 계약은 채굴자에게 $CAI로 지불합니다(종종 소액 결제를 일일 지급액으로 집계). Cuckoo는 신뢰성과 투명성을 강조합니다. 모든 참여자는 토큰을 스테이킹하고 모든 작업 할당 및 완료가 기록되므로, 지분을 잃을 위협과 성능의 공개적인 가시성으로 인해 부정행위가 억제됩니다. 네트워크의 모듈식 설계는 새로운 AI 모델이나 사용 사례를 쉽게 추가할 수 있음을 의미합니다. 개념 증명으로 텍스트-이미지 생성을 시작했지만, 그 아키텍처는 다른 AI 워크로드(예: 언어 모델 추론, 오디오 전사 등)를 지원할 만큼 일반적입니다.
Cuckoo 아키텍처의 주목할 만한 점은 AI 거래의 처리량을 극대화하기 위해 초기에 자체 레이어 1 블록체인을 출시했다는 것입니다(테스트 중 일일 30만 건의 거래에 도달). 이를 통해 AI 작업 스케줄링을 위한 맞춤형 최적화가 가능했습니다. 그러나 팀은 독립형 L1을 유지하는 것이 비용이 많이 들고 복잡하다는 것을 발견했고, 2025년 중반에 맞춤형 체인을 중단하고 이더리움의 롤업/AVS(Active Validated Service) 모델로 마이그레이션하기로 결정했습니다. 이는 Cuckoo가 자체 합의를 실행하는 대신 이더리움이나 Arbitrum과 같은 L2로부터 보안을 상속받지만, 해당 공유 보안 레이어에서 탈중앙화 AI 마켓플레이스를 계속 운영할 것임을 의미합니다. 이 변경은 경제적 보안을 개선하고(이더리움의 견고성 활용) Cuckoo 팀이 저수준 체인 유지보수 대신 제품에 집중할 수 있도록 하기 위한 것입니다. 요약하자면, Cuckoo의 아키텍처는 누구나 하드웨어를 연결하거나 AI 모델 서비스를 배포할 수 있고, 전 세계 사용자가 더 낮은 비용과 빅테크 인프라에 대한 의존도 감소로 AI 앱에 접근할 수 있는 탈중앙화 AI 서빙 플랫폼을 만듭니다.