Celestia의 데이터 가용성 샘플링이 초당 1 테라비트를 달성하는 방법: 기술 심층 분석
2026년 1월 13일, 셀레스티아(Celestia)는 단 하나의 벤치마크로 기대를 뛰어넘었습니다. 498개의 분산 노드에서 초당 **1테라비트(terabit per second)**의 데이터 처리량을 기록한 것입니다. 이는 이더리움의 가장 큰 레이어 2 롤업들의 일일 전체 트랜잭션 양을 1초도 안 되는 시간에 처리할 수 있는 대역폭입니다.
하지만 진짜 이야기는 헤드라인 숫자에만 있지 않습니다. 이를 가능하게 만든 암호화 인프라인 **데이터 가용성 샘플링(Data Availability Sampling, DAS)**이 핵심입니다. 이는 리소스가 제한된 라이트 노드가 전체 블록을 다운로드하지 않고도 블록체인 데이터의 가용성을 검증할 수 있게 해주는 획기적인 기술입니다. 롤업들이 이더리움의 기본 블롭(blob) 스토리지를 넘어 확장을 서두르는 상황에서, 셀레스티아가 어떻게 이러한 처리량을 달성했는지, 그리고 이것이 왜 롤업 경제학에 중요한지 이해하는 것이 그 어느 때보다 중요해졌습니다.
데이터 가용성 병목 현상: 롤업에 더 나은 솔루션이 필요한 이유
블록체인 확장성은 오랫동안 근본적인 트레이드오프(trade-off)에 의해 제약받아 왔습니다. 모든 노드가 모든 데이터를 다운로드하고 저장하게 하지 않으면서, 트랜잭션 데이터가 실제로 가용하다는 것을 어떻게 검증할 수 있을까요? 이것이 바로 데이터 가용성 문제이며, 롤업 확장의 주요 병목 현상입니다.
이더리움의 방식—모든 풀 노드가 전체 블록을 다운로드하도록 요구하는 것—은 접근성 장벽을 만듭니다. 블록 크기가 커질수록 풀 노드를 운영하기 위한 대역폭과 스토리지 비용을 감당할 수 있는 참여자가 줄어들어 탈중앙화가 위협받습니다. 이더리움 L1에 데이터를 게시하는 롤업들은 엄청난 비용에 직면합니다. 수요가 정점에 달할 때는 단일 배치(batch)의 가스비가 수천 달러에 달하기도 합니다.
여기서 모듈형 데이터 가용성 레이어가 등장합니다. 데이터 가용성을 실행 및 합의와 분리함으로써, 셀레스티아(Celestia), EigenDA, Avail과 같은 프로토콜들은 보안 보장을 유지하면서도 롤업 비용을 대폭 절감할 것을 약속합니다. 셀레스티아의 혁신은 무엇일까요? 바로 검증 모델을 뒤집는 샘플링 기술입니다. 가용성을 확인하기 위해 모든 데이터 를 다운로드하는 대신, 라이트 노드는 아주 작은 파편들을 무작위로 샘플링하여 전체 데이터셋이 존재한다는 통계적 확신을 얻습니다.
데이터 가용성 샘플링 설명: 다운로드 없이 라이트 노드가 검증하는 방법
본질적으로 DAS는 확률적 검증 메커니즘입니다. 작동 방식은 다음과 같습니다.
무작위 샘플링 및 신뢰 구축
라이트 노드는 전체 블록을 다운로드하지 않습니다. 대신 블록 데이터의 작은 부분들에 대해 여러 차례의 무작위 샘플링을 수행합니다. 각 샘플링이 성공할 때마다 전체 블록이 가용하다는 확신이 높아집니다.
수학적 원리는 명료합니다. 악의적인 검증자가 블록 데이터의 아주 작은 비율이라도 숨긴다면, 정직한 라이트 노드는 단 몇 번의 샘플링 라운드만으로도 데이터 가용성 부재를 높은 확률로 감지해 냅니다. 이를 통해 리소스가 제한된 장치도 데이터 가용성 검증에 참여할 수 있는 보안 모델이 생성됩니다.
구체적으로, 모든 라이트 노드는 확장된 데이터 행렬에서 무작위로 고유 좌표 세트를 선택하고 브릿지 노드에 해당 데이터 점유분(shares)과 머클 증명(Merkle proofs)을 요청합니다. 라이트 노드가 각 쿼리에 대해 유효한 응답을 받으면, 통계적 확률에 의해 전체 블록 데이터가 가용하다는 것이 보장됩니다.
2D 리드-솔로몬 인코딩: 수학적 토대
셀레스티아는 샘플링을 효율적이고 부정 방지(fraud-resistant)가 가능하게 만들기 위해 2차원 리드-솔로몬 인코딩 방식을 채용합니다. 기술적 흐름은 다음과 같습니다.
- 블록 데이터는 k × k 청크로 나뉘어 데이터 사각형을 형성합니다.
- **리드-솔로몬 삭제 정정 부호(Reed-Solomon erasure coding)**가 이를 2k × 2k 행렬로 확장합니다 (중복성 추가).
- 확장된 행렬의 각 행과 열에 대해 머클 루트가 계산됩니다.
- 이 루트들의 머클 루트가 블록 헤더의 블록 데이터 커밋먼트(data commitment)가 됩니다.
이 접근 방식은 중요한 특성을 가집니다. 확장된 행렬의 어떤 부분이 누락되면 인코딩 구조가 깨지며, 라이트 노드는 머클 증명을 검증할 때 불일치를 감지하게 됩니다. 공격자는 발각되지 않고 데이터를 선택적으로 숨길 수 없습니다.
네임스페이스 머클 트리: 롤업별 데이터 격리
멀티 롤업 환경에서 셀레스티아의 아키텍처가 빛을 발하는 지점은 바로 **네임스페이스 머클 트리(Namespaced Merkle Trees, NMTs)**입니다.
표준 머클 트리는 데이터를 임의로 그룹화합니다. 반면 NMT는 모든 노드에 자식 노드들의 최소 및 최대 네임스페이스 식별자를 태깅하고, 네임스페이스별로 리프(leaf)를 정렬합니다. 이를 통해 롤업은 다음과 같은 작업을 수행할 수 있습니다.
- DA 레이어에서 자신의 데이터만 다운로드
- 머클 증명을 통해 자신의 네임스페이스 데이터의 완전성을 입증
- 다른 롤업의 무관한 데이터를 완전히 무시
롤업 운영자에게 이는 경쟁 체인의 데이터를 다운로드하기 위해 대역폭 비용을 지불하지 않아도 됨을 의미합니다. 필요한 데이터만 정확히 가져와 암호화 증명으로 검증하고 다음 단계로 넘어갈 수 있습니다. 이는 모든 참여자가 모든 데이터를 처리해야 하는 모놀리식(monolithic) 체인과 비교했을 때 엄청난 효율성 향상을 가져옵니다.
Matcha 업그레이드: 128MB 블록으로의 확장
2025년, 셀레스티아는 모듈형 데이터 가용성의 분수령이 된 Matcha 업그레이드를 활성화했습니다. 주요 변경 사항은 다음과 같습니다.
블록 크기 확장
Matcha는 최대 블록 크기를 8MB에서 128MB로 늘려 처리 용량을 16배 향상시켰습니다. 이는 다음과 같은 수치로 나타납니다:
- 데이터 스퀘어 크기: 128 → 512
- 최대 트랜잭션 크기: 2MB → 8MB
- 지속적인 처리량: 테스트넷에서 21.33 MB/s 달성 (2025년 4월)
이를 비교해 보면, 이더리움의 목표 블롭(blob) 수는 블록당 6개(약 0.75 MB)이며, 최대 9개까지 확장 가능합니다. Celestia의 128MB 블록은 이 용량의 100배를 압도합니다.
고처리량 블록 전파
제약 사항은 단순히 블록 크기뿐만 아니라 블록 전파 속도였습니다. Matcha는 검증인 비동기화 현상 없이 네트워크 전체에 128MB 블록을 안전하게 배포하는 새로운 전파 메커니즘(CIP-38)을 도입했습니다.
테스트넷에서는 128MB 블록으로 6초의 블록 타임을 유지하며 21.33 MB/s의 처리량을 달성했습니다. 이는 현재 메인넷 용량의 16배에 해당합니다.
스토리지 비용 절감
가장 간과하기 쉬운 경제적 변화 중 하나는 Matcha가 최소 데이터 프루닝(pruning) 기간을 30일에서 7일 + 1시간으로 단축했다는 점입니다(CIP-34).
브릿지 노드의 경우, 예상 처리량 수준에서 스토리지 요구 사양이 30TB에서 7TB로 대폭 감소합니다. 인프라 제공업체의 운영 비용 절감은 곧 롤업을 위한 더 저렴한 데이터 가용성 비용으로 이어집니다.
토큰 경제학 개편
Matcha는 또한 TIA 토큰 경제학을 개선했습니다:
- 인플레이션 감축: 연간 5%에서 2.5%로 조정
- 검증인 수수료 인상: 최대 한도를 10%에서 20%로 상향
- 담보 특성 개선: TIA를 DeFi 유스케이스에 더 적합하게 개선
이러한 변화를 통해 Celestia는 1 GB/s 이상의 처리량을 향한 다음 단계의 확장을 준비하고 있습니다.
롤업 경제학: DA 시장 점유율 50%가 중요한 이유
2026년 초 현재, Celestia는 160 GB 이상의 롤업 데이터를 처리하며 **데이터 가용성(DA) 시장의 약 50%**를 점유하고 있습니다. 이러한 우위는 비용과 확장성을 우선시하는 롤업 개발자들의 실제 채택을 반영합니다.
비용 비교: Celestia vs 이더리움 블롭(Blobs)
Celestia의 수수료 모델은 단순합니다. 롤업은 블롭의 크기와 현재 가스 가격에 따라 비용을 지불합니다. 연산이 지배적인 실행 레이어와 달리, 데이터 가용성은 근본적으로 대역폭과 스토리지에 관한 것이며, 이는 하드웨어 개선에 따라 더 예측 가능하게 확장되는 자원입니다.
롤업 운영자들에게 이 수치는 매우 매력적입니다:
- 이더리움 L1 게시: 수요가 정점일 때 배치(batch) 제출 비용은 가스비로 $1,000 ~ $10,000 이상이 소요될 수 있습니다.
- Celestia DA: 동일한 데이터에 대해 배치당 1달러 미만의 비용이 듭니다.
이러한 100배 이상의 비용 절감은 롤업들이 모듈형 DA 솔루션으로 마이그레이션하는 이유입니다. 더 저렴한 데이터 가용성은 최종 사용자의 트랜잭션 수수료 인하로 직접 연결됩니다.