본문으로 건너뛰기

Aptos와 Jump Crypto, AI 데이터 인프라를 재편할 수 있는 검증 가능한 핫 스토리지 네트워크 Shelby 출시

· 약 9 분
Dora Noda
Software Engineer

모든 AI 모델은 학습 데이터만큼의 신뢰성만을 가집니다. 하지만 오늘날에는 그 데이터가 어디서 왔는지, 누구의 소유인지, 혹은 온전하게 전달되었는지 증명할 수 있는 신뢰할 수 있는 방법이 없습니다. Aptos Labs와 Jump Crypto는 이 누락된 계층을 구축했다고 믿습니다. 그들의 새로운 프로토콜인 셸비(Shelby)는 AI 읽기 워크로드를 위해 특별히 설계된 세계 최초의 검증 가능한 글로벌 객체 스토리지 네트워크이며, 현재 얼리 액세스 테스트넷이 운영 중입니다.

아무도 해결하지 못한 문제: 핫(Hot), 검증 가능, 탈중앙화 스토리지

탈중앙화 스토리지는 새로운 개념이 아닙니다. Filecoin은 2020년부터 엑사바이트 규모의 콜드 데이터를 아카이빙해 왔습니다. Arweave는 불변의 기록을 위해 일시불 결제 방식의 영구 스토리지를 제공합니다. 하지만 그 어떤 것도 2026년 AI 경제를 지배할 워크로드, 즉 밀리초 단위의 읽기, 글로벌 가용성, 그리고 모든 개별 요청에 대한 출처의 암호학적 증명을 요구하는 워크로드에 맞춰 설계되지 않았습니다.

분산된 데이터셋에서 수백만 개의 이미지-라벨 쌍을 가져오는 AI 학습 파이프라인을 생각해 보십시오. 혹은 50,000개의 센서가 실시간으로 추론 모델에 텔레메트리 데이터를 스트리밍하는 DePIN 네트워크를 떠올려 보십시오. 아니면 수백만 명의 사용자에게 동시에 개인화된 콘텐츠 피드를 제공하는 소셜 플랫폼도 있습니다. 이 모든 경우에 데이터는 '핫(hot)'해야 합니다. 즉, 검색 거래가 처리되기를 기다리며 테이프 드라이브에 보관되는 것이 아니라 즉시 액세스 가능해야 합니다.

AWS S3와 같은 클라우드 제공업체는 핫 스토리지를 손쉽게 처리하지만, 검증 가능성은 전혀 제공하지 않습니다. 귀하가 받은 객체가 원래 저장된 것과 동일한지, 전송 중에 중간자가 조작하지 않았는지, 혹은 콘텐츠 제작자가 실제로 사용에 동의했는지 증명할 방법이 없습니다. 전 세계적으로 AI 규제가 강화됨에 따라 — EU AI 법은 이제 학습 데이터 출처 문서화를 요구함 — 이러한 공백은 법적 책임이 되고 있습니다.

셸비는 클라우드 급의 읽기 성능, 암호학적 검증 영수증, 그리고 단일 엔티티가 제어하지 않는 탈중앙화 인프라라는, 이전까지 단일 시스템으로 결합된 적 없는 세 가지 요소를 결합하여 이 공백을 메웁니다.

셸비의 작동 방식: 새로운 스토리지 프리미티브의 아키텍처

셸비의 설계는 Web2 인프라와 블록체인 프로토콜 엔지니어링 모두에서 얻은 교훈을 반영합니다. 그 아키텍처는 제어 평면(Control Plane, 조정, 결제, 검증)과 데이터 평면(Data Plane, 실제 저장 및 전달)을 깔끔하게 분리하며, 이는 대규모 클라우드 인프라를 운영해 본 사람이라면 익숙한 패턴입니다.

데이터 평면: DoubleZero와 Jump Crypto의 우위

물리적 계층은 아마도 셸비의 가장 과소평가된 강점일 것입니다. 지연 시간을 예측할 수 없고 대역폭을 공유하는 공용 인터넷에 의존하는 대신, 셸비는 5개 대륙 30개 이상의 도시에 걸친 전용 파이버 백본인 DoubleZero에서 실행됩니다. 이는 고빈도 매매(HFT) 기업들이 마이크로초 단위의 실행을 위해 사용하는 것과 동일한 등급의 네트워크 인프라입니다.

Jump Crypto는 크립토 분야에서 가장 기술적으로 정교한 기업 중 하나로, 데이터 검색 지연 시간이 곧 실제 금융 비용으로 직결되는 퀀트 거래 환경에서 단련된 스토리지 인프라를 제공합니다. 전용 파이버와 트레이딩 등급의 스토리지 노드의 결합을 통해 셸비는 모든 지역에서 1초 미만의 읽기 성능을 보장할 수 있습니다.

데이터는 높은 가용성을 유지하면서 복제 오버헤드를 최소화하는 기술인 **Clay 이레이저 코딩(erasure coding)**을 사용하여 인코딩됩니다. 단순히 복사본을 저장하는 방식(3개 복사본 저장)과 달리, 이레이저 코딩은 데이터를 파편으로 나누고 노드에 분산시켜 파편의 일부만으로도 원본을 재구성할 수 있게 합니다. 이는 기가바이트당 스토리지 비용을 낮추고 노드가 오프라인 상태가 될 때 복구 대역폭을 최소화함을 의미합니다.

제어 평면: 검증 계층으로서의 Aptos

셸비가 제공하는 모든 읽기 요청은 다음과 같은 내용을 문서화하는 **암호학적 영수증(cryptographic receipt)**을 반환할 수 있습니다.

  • 무엇이 전달되었는가 (콘텐츠 해시)
  • 언제 전달이 이루어졌는가 (타임스탬프)
  • 어디서 데이터가 시작되었는가 (스토리지 노드 식별자)
  • 어떤 권한 하에 액세스가 허용되었는가 (라이선스 및 동의 메타데이터)

이 영수증들은 결제 및 조정 기판 역할을 하는 Aptos 블록체인에 고정(anchor)됩니다. Aptos는 600밀리초의 최종성(finality), 초당 30,000건의 트랜잭션, $0.000005 수준의 낮은 가스비 등 성능 특성 때문에 선택되었습니다. 이는 매일 수백만 개의 검증 영수증을 블록체인에 기록하는 것이 경제적으로 가능하다는 것을 의미하며, 이는 이더리움 메인넷에서는 비용 문제로 불가능했을 일입니다.

Aptos가 네이티브 조정 계층이긴 하지만, 셸비는 **체인 애그노스틱(chain-agnostic)**으로 설계되었습니다. 이더리움, 솔라나 및 기타 체인에 대한 지원이 계획되어 있어, 모든 블록체인의 애플리케이션이 전체 스택을 이전하지 않고도 셸비의 검증된 스토리지를 활용할 수 있습니다.

경제 모델: 읽기당 지불(Pay-Per-Read) 소액 결제

셸비는 소액 결제 채널을 통한 읽기당 지불(pay-per-read) 경제 모델을 도입했습니다. 이는 Filecoin의 선불 스토리지 계약이나 Arweave의 일회성 영구 수수료 방식과는 차별화됩니다. 이는 실제 사용량에 따라 인센티브를 정렬합니다. 스토리지 제공업체는 데이터가 액세스되는 빈도에 비례하여 수익을 창출하므로, 인기 있는 데이터를 핫(hot) 상태로 유지하고 가용성을 확보하려는 자연스러운 경제적 압력이 형성됩니다.

이 모델은 단일 학습 과정 동안 학습 데이터셋이 수십억 번 읽히지만 그 이후에는 드물게 액세스되는 AI 워크로드에 특히 적합합니다. 셸비의 모델 하에 비용은 아카이브 영구성을 위한 선제적 약정보다는 실제 수요를 따르게 됩니다.

AI 가 검증 가능한 스토리지를 지금 당장 필요로 하는 이유

Shelby 의 출시 시점은 우연이 아닙니다 . 세 가지의 결합된 동력이 검증 가능한 데이터 인프라에 대한 긴급한 수요를 창출하고 있습니다 .

데이터 출처 (Data Provenance) 위기

AI 모델이 더욱 강력해짐에 따라 " 이 모델은 어떤 데이터로 학습되었는가 ?" 라는 질문은 학술적 호기심을 넘어 규제 요구 사항으로 이동했습니다 . EU AI 법 (EU AI Act) 은 학습 데이터 소스의 문서화를 의무화하고 있습니다 . 미국의 AI 안전에 관한 행정명령은 데이터 출처 (Provenance) 를 강조하며 , 중국의 생성형 AI 규제는 콘텐츠 추적 가능성을 요구합니다 .

하지만 오늘날의 인프라는 이러한 요구 사항을 강제할 체계적인 방법을 제공하지 못합니다 . 학습 데이터는 일반적으로 S3 버킷에서 다운로드되거나 , 웹사이트에서 스크래핑되거나 , 암호학적 관리 연속성 (Chain of custody) 이 없는 불투명한 계약을 통해 라이선스가 부여됩니다 . Shelby 의 검증 영수증은 모든 학습 데이터가 적절한 동의와 라이선스 하에 액세스되었음을 온체인에서 증명할 수 있는 감사 가능한 추적 경로를 생성합니다 .

AI 데이터 시장의 기회

AI 학습 데이터 시장은 2030 년까지 500 억 달러를 초과할 것으로 예상됩니다 . 그러나 현재의 마켓플레이스 모델은 결함이 있습니다 . 데이터 제공자는 구매자가 사용 제한 사항을 준수하는지 확인할 방법이 없으며 , 구매자는 데이터가 전달되기 전에 변조되지 않았는지 확인할 방법이 없습니다 .

Shelby 는 동의 , 귀속 및 라이선스 조건이 데이터 객체 자체와 함께 이동하는 새로운 범주의 검증 가능한 데이터 마켓플레이스를 가능하게 합니다 . 데이터 세트 소유자는 라이선스 메타데이터가 포함된 학습 데이터를 Shelby 에 게시할 수 있으며 , 이후의 모든 액세스는 규정 준수를 증명하거나 위반 사항을 노출하는 암호학적 영수증을 생성합니다 .

DePIN 데이터의 폭발적 증가

DePIN 분야는 2024 년 시가총액 52 억 달러에서 2025 년 190 억 달러 이상으로 성장하며 약 270% 의 성장률을 기록했습니다 . CoinGecko 는 현재 대규모로 센서 데이터 , 텔레메트리 및 사용자 콘텐츠를 생성하는 250 개 이상의 DePIN 프로젝트를 추적하고 있습니다 .

이러한 네트워크에는 실시간 추론 (Inference) 을 위해 충분히 빠르면서도 데이터 진위 여부를 증명할 수 있을 만큼 검증 가능한 핫 스토리지 (Hot storage) 가 필요합니다 . 10,000 개의 탈중앙화 기상 관측소에서 읽은 값을 사용하는 기상 예측 모델은 각 판독값이 진짜이고 , 수정되지 않았으며 , 주장된 지리적 위치에서 전달되었음을 알아야 합니다 . 저지연 전송과 읽기당 검증을 결합한 Shelby 의 아키텍처는 바로 이러한 사용 사례를 위해 목적으로 구축되었습니다 .

Shelby 와 탈중앙화 스토리지 환경 비교

Shelby 가 어디에 적합한지 이해하려면 탈중앙화 스토리지 시장이 어떻게 성숙해졌는지 살펴봐야 합니다 .

기능FilecoinArweaveAkave CloudShelby
주요 사용 사례아카이브 / 콜드 스토리지영구적인 불변 스토리지S3 호환 기업용 백업AI 읽기용 핫 스토리지
지연 시간 (Latency)수 초에서 수 분수 초1 초 미만1 초 미만
검증 (Verification)저장 증명 (Proof of storage)액세스 증명 (묶음 형태)암호학적 감사 추적읽기당 암호학적 영수증
비용 모델스토리지 거래 (선불)일회성 영구 수수료사용량 기반 지불 (AWS 대비 80% 저렴)읽기당 소액 결제 (Pay-per-read)
네트워크공용 인터넷공용 인터넷공용 인터넷전용 파이버 (DoubleZero)
최적의 용도장기 아카이브 , 백업영구 기록 , 출판기업용 클라우드 대체AI 파이프라인 , DePIN , 스트리밍

핵심 통찰은 이들이 경쟁 솔루션이 아니라 보완적 솔루션이라는 점입니다 . Filecoin 은 장기 아카이브에 탁월합니다 . Arweave 는 영원히 존재해야 하는 데이터에 이상적입니다 . Akave 는 기업을 위해 익숙한 S3 호환 인터페이스를 제공합니다 . Shelby 는 이전에는 비어 있던 사분면을 차지합니다 . 즉 , 프로덕션 AI 워크로드에 충분히 빠르면서도 규제 요구 사항을 충족할 만큼 검증 가능한 탈중앙화 스토리지입니다 .

개발자가 구축할 수 있는 것

Shelby 의 얼리 액세스 테스트넷은 몇 가지 새로운 애플리케이션 카테고리를 열어줍니다 .

AI 데이터 마켓플레이스: 데이터 제공자가 라이선스 조건이 포함된 데이터 세트를 게시하고 , 모든 모델 트레이너의 액세스가 검증 가능한 규정 준수 영수증을 생성하는 플랫폼입니다 . 이는 AI 학습 데이터 권리를 둘러싼 법적 환경을 변화시킬 수 있습니다 .

검증 가능한 AI 학습 파이프라인: 조직은 데이터 수집부터 모델 배포까지 완전한 온체인 감사 추적을 통해 자사 모델이 적절하게 라이선스를 받은 데이터로만 학습되었음을 규제 기관과 감사인에게 증명할 수 있습니다 .

실시간 DePIN 애플리케이션: 센서 네트워크 , 자율주행 차량 플릿 및 IoT 메시는 읽기당 검증을 통해 Shelby 를 통해 데이터를 스트리밍할 수 있으므로 , 다운스트림 AI 모델이 중앙 집중식 게이트키퍼에 의존하지 않고도 입력 데이터를 신뢰할 수 있게 해줍니다 .

탈중앙화 콘텐츠 전송: 소셜 플랫폼과 미디어 애플리케이션은 콘텐츠 출처와 제작자 권리에 대한 암호학적 증명을 유지하면서 1 초 미만의 지연 시간으로 콘텐츠를 전 세계에 서비스할 수 있습니다 . 이는 딥페이크 귀속 문제에 대한 잠재적인 해결책이 될 수 있습니다 .

향후 전망

Shelby 의 얼리 액세스 테스트넷은 다단계 출시의 시작을 의미합니다 . 2025 년 말에 개발자 중심의 데브넷 (Devnet) 이 출시되었으며 , 현재의 공개 테스트넷을 통해 AI 팀과 개발자는 Shelby 를 실제 워크로드에 통합하기 시작할 수 있습니다 . 전체 프로덕션 출시는 2026 년 하반기로 예상됩니다 .

광범위한 블록체인 AI 인프라 시장은 2024 년 60 억 달러에서 2030 년 500 억 달러로 성장하여 연평균 성장률 (CAGR) 42.4% 를 기록할 것으로 예상됩니다 . 해당 시장 내에서 , 데이터가 단순히 존재한다는 것뿐만 아니라 올바르고 합의된 방식에 따라 변조 없이 액세스되었음을 증명하는 능력인 ' 검증 가능한 데이터 인프라 ' 는 가장 가치 있는 프리미티브 (Primitive) 임이 증명될 것입니다 .

Shelby 가 아키텍처의 약속을 이행한다면 , 이는 단순한 또 다른 스토리지 프로토콜에 그치지 않을 것입니다 . 이는 AI 경제가 필요로 하지만 한 번도 가져보지 못했던 신뢰 계층 , 즉 " 데이터 사용 가능 " 과 " 데이터 검증됨 " 사이의 암호학적 가교가 될 것입니다 .

Shelby 와 같은 프로토콜이 Aptos 에서 가능한 영역을 확장하며 블록체인 인프라가 계속 발전함에 따라 , 개발자는 이러한 혁신을 주도하는 네트워크에 대한 안정적인 액세스가 필요합니다 . BlockEden.xyz 는 Aptos 및 20 개 이상의 다른 체인에 대해 엔터프라이즈급 RPC 및 API 서비스를 제공하여 , 빌더들이 차세대 프로토콜과 통합할 수 있는 토대를 마련해 줍니다 .