Aptos und Jump Crypto führen Shelby ein: Das verifizierbare Hot-Storage-Netzwerk, das die KI-Dateninfrastruktur neu gestalten könnte
Jedes KI-Modell ist nur so vertrauenswürdig wie die Daten, auf denen es trainiert wurde – dennoch gibt es heute keine zuverlässige Methode, um zu beweisen, woher diese Daten stammen, wem sie gehören oder ob sie unversehrt angekommen sind. Aptos Labs und Jump Crypto sind davon überzeugt, die fehlende Schicht entwickelt zu haben. Ihr neues Protokoll, Shelby, ist das weltweit erste verifizierbare globale Objekt-Speichernetzwerk, das speziell für KI-Lese-Workloads konzipiert wurde, und sein Early-Access-Testnet ist ab sofort live.
Das Problem, das niemand gelöst hat: Hot, verifizierbarer, dezentraler Speicher
Dezentraler Speicher ist nicht neu. Filecoin archiviert seit 2020 Exabyte an Cold Data. Arweave bietet permanenten Pay-once-Speicher für unveränderliche Datensätze. Doch keines von beiden wurde für die Workloads entwickelt, die die KI-Wirtschaft von 2026 dominieren – Workloads, die Lesezugriffe im Millisekundenbereich, globale Verfügbarkeit und kryptografische Provenienznachweise für jede einzelne Anfrage erfordern.
Denken Sie an eine KI-Trainings-Pipeline, die Millionen von Bild-Label-Paaren aus einem verteilten Datensatz abruft. Oder ein DePIN-Netzwerk aus 50.000 Sensoren, die Telemetrie-Daten in Echtzeit an Inferenzmodelle streamen. Oder eine soziale Plattform, die personalisierte Content-Feeds gleichzeitig an Millionen von Nutzern ausliefert. In all diesen Fällen müssen die Daten „hot“ sein: sofort zugänglich und nicht auf Bandlaufwerken archiviert, während man darauf wartet, dass ein Abrufauftrag freigegeben wird.
Cloud-Anbieter wie AWS S3 bewältigen Hot Storage mühelos – aber sie bieten keinerlei Verifizierbarkeit. Sie können nicht beweisen, dass das Objekt, das Sie erhalten haben, dasselbe ist, das ursprünglich gespeichert wurde, dass kein Vermittler es während der Übertragung manipuliert hat oder dass der Ersteller der Inhalte tatsächlich der Nutzung zugestimmt hat. Da die KI-Regulierung weltweit strenger wird – der EU AI Act erfordert nun die Dokumentation der Provenienz von Trainingsdaten –, wird diese Lücke zu einem Haftungsrisiko.
Shelby schließt diese Lücke, indem es drei Zutaten kombiniert, die noch nie in einem einzigen System vereint wurden: Leseleistung auf Cloud-Niveau, kryptografische Verifizierungsbelege und eine dezentrale Infrastruktur, die von keiner einzelnen Einheit kontrolliert wird.
Wie Shelby funktioniert: Die Architektur eines neuen Storage-Primitivs
Das Design von Shelby spiegelt die Lehren wider, die sowohl aus der Web2-Infrastruktur als auch aus dem Blockchain-Protokoll-Engineering gezogen wurden. Seine Architektur trennt strikt die Control Plane (Koordinierung, Zahlung, Verifizierung) von der Data Plane (eigentliche Speicherung und Auslieferung) – ein Muster, das jedem vertraut ist, der Cloud-Infrastrukturen in großem Maßstab betrieben hat.
Die Data Plane: Der Vorsprung durch DoubleZero und Jump Crypto
Die physische Ebene ist vielleicht der am meisten unterschätzte Vorteil von Shelby. Anstatt sich auf das öffentliche Internet zu verlassen – wo Latenzen unvorhersehbar sind und die Bandbreite geteilt wird –, läuft Shelby auf DoubleZero, einem dedizierten Glasfaser-Backbone, der mehr als 30 Städte auf fünf Kontinenten umfasst. Dies ist die gleiche Klasse von Netzwerkinfrastruktur, die Hochfrequenzhandelsfirmen für die Ausführung im Mikrosekundenbereich nutzen.
Jump Crypto, eines der technisch anspruchsvollsten Unternehmen im Krypto-Bereich, bringt eine Speicherinfrastruktur ein, die in quantitativen Handelsumgebungen gehärtet wurde, in denen jede Millisekunde Latenz beim Datenabruf direkte finanzielle Kosten verursacht. Die Kombination aus dedizierter Glasfaser und Storage-Nodes auf Trading-Niveau ermöglicht es Shelby, Lesezugriffe in unter einer Sekunde aus jeder Region zu versprechen.
Daten werden mittels Clay Erasure Coding kodiert, einer Technik, die den Replikations-Overhead minimiert und gleichzeitig eine hohe Verfügbarkeit gewährleistet. Im Gegensatz zur einfachen Replikation (Speichern von drei Kopien) teilt Erasure Coding die Daten in Fragmente auf und verteilt sie so über die Knoten, dass jeder Teilaspekt der Fragmente das Original rekonstruieren kann. Dies bedeutet geringere Speicherkosten pro Gigabyte und minimale Reparatur-Bandbreite, wenn Knoten offline gehen.
Die Control Plane: Aptos als Verifizierungsschicht
Jede von Shelby bediente Leseanfrage kann einen kryptografischen Beleg zurückgeben – einen verifizierbaren Nachweis, der dokumentiert:
- Was geliefert wurde (Content-Hash)
- Wann die Lieferung erfolgte (Zeitstempel)
- Woher die Daten stammten (Identität des Storage-Nodes)
- Unter welchen Rechten der Zugriff gewährt wurde (Metadaten zu Lizenzierung und Zustimmung)
Diese Belege sind auf der Aptos-Blockchain verankert, die als Abrechnungs- und Koordinationssubstrat dient. Aptos wurde aufgrund seiner Leistungsmerkmale ausgewählt: 600 Millisekunden Finalität, 30.000 Transaktionen pro Sekunde und Gas-Gebühren von nur 0,000005 $. Dies bedeutet, dass die Verankerung von Millionen von Verifizierungsbelegen pro Tag wirtschaftlich rentabel ist – etwas, das auf dem Ethereum-Mainnet prohibitiv teuer wäre.
Während Aptos die native Koordinationsschicht ist, wurde Shelby so konzipiert, dass es chain-agnostisch ist. Unterstützung für Ethereum, Solana und andere Chains ist geplant, sodass Anwendungen auf jeder Blockchain den verifizierten Speicher von Shelby nutzen können, ohne ihren gesamten Stack migrieren zu müssen.
Das Wirtschaftsmodell: Pay-Per-Read Micropayments
Shelby führt ein Pay-Per-Read-Wirtschaftsmodell über Micropayment-Kanäle ein, eine Abkehr von den im Voraus bezahlten Speicherverträgen bei Filecoin oder den einmaligen permanenten Gebühren bei Arweave. Dies gleicht die Anreize mit der tatsächlichen Nutzung ab: Speicheranbieter erzielen Einnahmen proportional dazu, wie häufig auf ihre Daten zugegriffen wird, was einen natürlichen wirtschaftlichen Druck erzeugt, beliebte Daten „hot“ und verfügbar zu halten.
Dieses Modell eignet sich besonders gut für KI-Workloads, bei denen ein Trainingsdatensatz während eines einzelnen Trainingslaufs Milliarden Mal gelesen, danach aber nur noch selten abgerufen werden könnte. Unter dem Modell von Shelby folgen die Kosten der tatsächlichen Nachfrage, anstatt eine Vorabverpflichtung für die Langzeitarchivierung zu erfordern.
Warum KI jetzt verifizierbaren Speicher benötigt
Der Zeitpunkt für den Start von Shelby ist kein Zufall. Drei zusammenwirkende Kräfte erzeugen eine dringende Nachfrage nach verifizierbarer Dateninfrastruktur.
Die Krise der Datenherkunft (Data Provenance)
Da KI-Modelle immer leistungsfähiger werden, hat sich die Frage „Mit welchen Daten wurde dieses Modell trainiert?“ von akademischer Neugier zu einer regulatorischen Anforderung gewandelt. Das EU-KI-Gesetz (EU AI Act) schreibt die Dokumentation von Trainingsdatenquellen vor. Die US-Exekutivverordnung zur KI-Sicherheit betont die Datenherkunft. Chinas Verordnungen für generative KI erfordern die Rückverfolgbarkeit von Inhalten.
Dennoch bietet die heutige Infrastruktur keine systematische Möglichkeit, diese Anforderungen durchzusetzen. Trainingsdaten werden in der Regel aus S3-Buckets heruntergeladen, von Websites gecrawlt oder über undurchsichtige Vereinbarungen ohne kryptografische Beweiskette lizenziert. Die Verifizierungsbelege von Shelby erstellen einen prüfbaren Pfad, der on-chain beweisen kann, dass auf jedes Teil der Trainingsdaten mit ordnungsgemäßer Zustimmung und Lizenzierung zugegriffen wurde.
Die Marktchance für KI-Daten
Der Markt für KI-Trainingsdaten wird bis 2030 voraussichtlich 50 Milliarden USD überschreiten. Doch das aktuelle Marktplatzmodell ist unzureichend: Datenanbieter haben keine Möglichkeit zu überprüfen, ob Käufer Nutzungsbeschränkungen einhalten, und Käufer können nicht verifizieren, ob Daten vor der Auslieferung manipuliert wurden.
Shelby ermöglicht eine neue Kategorie von verifizierbaren Datenmarktplätzen, bei denen Zustimmung, Attribution und Lizenzbedingungen mit dem Datenobjekt selbst reisen. Ein Datensatzbesitzer kann Trainingsdaten auf Shelby mit eingebetteten Lizenz-Metadaten veröffentlichen, und jeder nachfolgende Zugriff erzeugt einen kryptografischen Beleg, der die Compliance beweist – oder Verstöße aufdeckt.
Die DePIN-Datenexplosion
Der DePIN-Sektor ist von einer Marktkapitalisierung von 5,2 Milliarden USD im Jahr 2024 auf über 19 Milliarden USD im Jahr 2025 angewachsen, was einem Wachstum von fast 270 % entspricht. CoinGecko trackt mittlerweile über 250 DePIN-Projekte, die Sensordaten, Telemetrie und Benutzerinhalte in gewaltigem Ausmaß generieren.
Diese Netzwerke benötigen Hot Storage, der sowohl schnell genug für Echtzeit-Inferenz als auch verifizierbar genug ist, um die Authentizität der Daten zu beweisen. Ein Wettervorhersagemodell, das Messwerte von 10.000 dezentralen Wetterstationen verarbeitet, muss wissen, dass jeder Messwert echt, unverändert und vom angegebenen geografischen Standort geliefert wurde. Die Architektur von Shelby – die eine Bereitstellung mit niedriger Latenz mit einer Verifizierung pro Lesevorgang kombiniert – ist genau für diesen Anwendungsfall konzipiert.
Shelby im Vergleich zur dezentralen Speicherlandschaft
Um zu verstehen, wo Shelby einzuordnen ist, muss man untersuchen, wie der dezentrale Speichermarkt gereift ist.
| Merkmal | Filecoin | Arweave | Akave Cloud | Shelby |
|---|---|---|---|---|
| Primärer Anwendungsfall | Archivierung / Cold Storage | Permanenter, unveränderlicher Speicher | S3-kompatibles Enterprise-Backup | Hot Storage für KI-Lesevorgänge |
| Latenz | Sekunden bis Minuten | Sekunden | Sub-Sekunde | Sub-Sekunde |
| Verifizierung | Proof of Storage | Proof of Access (gebündelt) | Kryptografische Audit-Trails | Kryptografische Belege pro Lesevorgang |
| Kostenmodell | Storage Deals (im Voraus) | Einmalige permanente Gebühr | Pay-as-you-go (80 % günstiger als AWS) | Micropayments pro Lesevorgang |
| Netzwerk | Öffentliches Internet | Öffentliches Internet | Öffentliches Internet | Dedizierte Glasfaser (DoubleZero) |
| Bestens geeignet für | Langzeitarchivierung, Backups | Permanente Aufzeichnungen, Publishing | Cloud-Ersatz für Unternehmen | KI-Pipelines, DePIN, Streaming |
Die entscheidende Erkenntnis ist, dass dies komplementäre und keine konkurrierenden Lösungen sind. Filecoin brilliert bei der Langzeitarchivierung. Arweave ist ideal für Daten, die für immer existieren müssen. Akave bietet eine vertraute S3-kompatible Schnittstelle für Unternehmen. Shelby besetzt den bisher leeren Quadranten: dezentraler Speicher, der sowohl schnell genug für produktive KI-Workloads als auch verifizierbar genug ist, um regulatorische Anforderungen zu erfüllen.
Was Entwickler bauen können
Das Early-Access-Testnetz von Shelby eröffnet mehrere neue Anwendungskategorien.
KI-Datenmarktplätze: Plattformen, auf denen Datenanbieter Datensätze mit eingebetteten Lizenzbedingungen veröffentlichen und jeder Zugriff eines Modelltrainers verifizierbare Compliance-Belege erzeugt. Dies könnte die Rechtslandschaft rund um die Rechte an KI-Trainingsdaten grundlegend verändern.
Verifizierbare KI-Trainings-Pipelines: Organisationen können Aufsichtsbehörden und Auditoren beweisen, dass ihre Modelle ausschließlich mit ordnungsgemäß lizenzierten Daten trainiert wurden, mit einem vollständigen On-Chain-Audit-Trail von der Datenaufnahme bis zur Modellbereitstellung.
Echtzeit-DePIN-Anwendungen: Sensornetzwerke, autonome Fahrzeugflotten und IoT-Meshes können Daten über Shelby mit einer Verifizierung pro Lesevorgang streamen, sodass nachgeschaltete KI-Modelle ihren Eingangsdaten vertrauen können, ohne sich auf zentrale Gatekeeper verlassen zu müssen.
Dezentrale Inhaltsbereitstellung: Soziale Plattformen und Medienanwendungen können Inhalte weltweit mit einer Latenz von unter einer Sekunde bereitstellen und gleichzeitig den kryptografischen Nachweis der Herkunft der Inhalte und der Urheberrechte wahren – eine potenzielle Lösung für das Problem der Deepfake-Attribution.
Der Weg in die Zukunft
Das Early-Access-Testnetz von Shelby stellt den Beginn eines mehrphasigen Rollouts dar. Ein entwicklerorientiertes Devnet startete Ende 2025, und das aktuelle öffentliche Testnetz ermöglicht es KI-Teams und Entwicklern, Shelby in reale Workloads zu integrieren. Der vollständige Produktionsstart wird für das Jahr 2026 erwartet.
Der breitere Markt für Blockchain-KI-Infrastruktur wird voraussichtlich von 6 Milliarden USD im Jahr 2024 auf 50 Milliarden USD bis 2030 wachsen, was einer kumulierten jährlichen Wachstumsrate (CAGR) von 42,4 % entspricht. Innerhalb dieses Marktes könnte sich eine verifizierbare Dateninfrastruktur – die Fähigkeit zu beweisen, dass Daten nicht nur existieren, sondern auch korrekt, einvernehmlich und ohne Manipulation abgerufen wurden – als das wertvollste Primitiv erweisen.
Wenn Shelby das Versprechen seiner Architektur einlöst, wird es nicht nur ein weiteres Speicherprotokoll sein. Es wird die Vertrauensebene sein, die die KI-Ökonomie benötigt, aber nie zuvor hatte – die kryptografische Brücke zwischen „Daten verfügbar“ und „Daten verifiziert“.
Da sich die Blockchain-Infrastruktur mit Protokollen wie Shelby, die die Grenzen des auf Aptos Möglichen verschieben, ständig weiterentwickelt, benötigen Entwickler einen zuverlässigen Zugang zu den Netzwerken, die diese Innovationen vorantreiben. BlockEden.xyz bietet RPC- und API-Dienste der Enterprise-Klasse für Aptos und über 20 weitere Chains und bietet Entwicklern das Fundament für die Integration in Protokolle der nächsten Generation.