온체인으로 향하는 Qwen: 0G × Alibaba Cloud가 자율형 에이전트를 위해 AI 스택을 재구성한 방법
AI의 짧은 역사상 처음으로, 하이퍼스케일러가 자사의 플래그십 대규모 언어 모델(LLM)에 대한 제어권을 블록체인에 넘겼습니다. 2026년 4월 21일, 0G Foundation과 Alibaba Cloud는 세계에서 가장 많이 다운로드된 오픈 소스 LLM 제품군인 Qwen을 온체인 상의 자율 에이전트가 직접 호출할 수 있도록 하는 파트너십을 발표했습니다. 추론 비용은 API 키가 아닌 토큰으로 결제됩니다.
다시 한번 읽어보십시오. 계정 가입도, 신용카드도, 속도 제한 신청 양식도 없습니다. 지갑을 가진 에이전트는 스마트 컨트랙트가 Uniswap 풀을 호출하는 것과 동일한 방식으로 Qwen3.6을 호출하고 100만 토큰당 비용을 $0G로 지불할 수 있습니다. 파운데이션 모델 추론을 SaaS 제품이 아닌 프로그래밍 가능한 리소스로 취급하는 이 단 하나의 아키텍처 변화는 올해 가장 중대한 크립토-AI 이슈가 될 수 있습니다.
모 두가 놓친 주요 수치
이 이야기를 재구성하는 통계가 여기 있습니다. 2026년 3월 기준 Qwen 제품군은 누적 다운로드 약 9억 4,200만 건을 돌파했으며, 2월 한 달에만 1억 5,360만 건을 기록했습니다. Alibaba Cloud는 현재 전 세계 오픈 소스 LLM 다운로드의 50% 이상을 차지하고 있으며, 이는 하위 8개 업체의 다운로드 합계를 합친 것보다 두 배 이상 많습니다. Qwen은 비주류 모델이 아닙니다. 세계에서 가장 지배적인 오픈 웨이트(open-weight) 스택입니다.
이러한 배경 속에서 Alibaba가 Qwen에 대한 프로덕션 액세스를 새로운 유료 API 계층이 아닌 탈중앙화 체인을 통해 라우팅하기로 결정한 것은 단순한 실험이 아닙니다. 이것은 시장 진출 전략(GTM)의 피벗입니다. Alibaba는 온체인 에이전트가 점유할 가치가 있는 채널이라고 판단했습니다.
이것이 바로 OpenAI, Anthropic, Google을 긴장시켜야 할 디테일입니다. 오픈 소스 리더는 자율 에이전트가 독립적인 고객 세그먼트이며, 이들에게 서비스를 제공하기 위한 적절한 인터페이스는 API 키가 있는 REST 엔드포인트가 아니라 토큰 미터링 기능이 있는 스마트 컨트랙트라고 선언한 것입니다.
스택의 실제 작동 방식
아키텍처는 의외로 단순합니다. 0G의 제안은 전체 설계 철학을 요약하는 한 문장으로 축약 됩니다.
추론은 Qwen에서 실행되고, 검증은 0G에서 실행됩니다.
내부적으로 0G는 API를 통해 Alibaba Cloud로부터 Qwen 추론 용량을 조달하고 이를 자체 검증 가능한 연산 계층 내에 래핑합니다. 온체인 에이전트가 텍스트 생성을 원할 때 0G의 추론 컨트랙트를 호출하고 고시된 수수료를 $0G 토큰으로 지불하며(현재 테스트넷 기준 100만 입력 토큰당 0.05 $0G), 실행 기록이 0G의 데이터 가용성 계층에 고정된 응답을 받습니다.
그 분할은 겉보기보다 더 중요합니다. 순수 중앙집중식 LLM API는 "모델이 실제로 말한 대로 실행했는가"라는 질문에 결코 답할 수 없습니다. 순수 탈중앙화 추론 네트워크(Bittensor 서브넷, Ritual의 Infernet, Allora의 예측 시장)는 실행을 검증할 수 있지만, 자신이 호스팅하는 모델만 검증할 수 있으며 이 중 Qwen3.6급의 프런티어 시스템은 없습니다. 0G × Alibaba 구조는 하이브리드입니다. 하이퍼스케일러 모델의 품질과 블록체인 영수증의 감사 가능성을 동시에 얻을 수 있습니다.
실제 자본을 관리하는 DeFAI 에이전트에게 이 이중 계층 신뢰 모델은 핵심 열쇠입니다. 기관 할당자들은 지난 18개월 동안 "에이전트가 실제로 주장한 전략을 실행했는지 어떻게 알 수 있는가?"라는 동일한 질문을 해왔습니다. 추론이 불투명하고 오프체인일 때는 답할 수 없습니다. 추론 호출 자체가 블록체인 트랜잭션에 미터링되어 기록될 때 비로소 답할 수 있습니다.