Рынки данных встречают обучение ИИ: как блокчейн решает кризис ценообразования данных на 23 миллиарда долларов
Индустрия ИИ столкнулась с парадоксом: глобальный объем производства данных вырастет с 33 зеттабайт до 175 зеттабайт к 2025 году, однако качество моделей ИИ стагнирует. Проблема не в дефиците данных, а в том, что у поставщиков данных нет возможности извлекать выгоду из своего вклада. На сцену выходят блокчейн-рынки данных, такие как Ocean Protocol, LazAI и ZENi, которые превращают данные для обучения ИИ из бесплатного ресурса в монетизируемый класс активов, стоимость которого к 2034 году достигнет 23,18 миллиарда долларов.
Проблема ценообразования данных на 23 миллиарда долларов
Затраты на обучение ИИ выросли на 89 % в период с 2023 по 2025 год, при этом сбор и разметка данных поглощают до 80 % бюджетов проектов по машинному обучению. Тем не менее, создатели данных — обычные люди, генерирующие поисковые запросы, взаимодействия в социальных сетях и поведенческие паттерны — не получают ничего, в то время как технологические гиганты извлекают миллиардную прибыль.
Рынок наборов данных для обучения ИИ наглядно демонстрирует этот разрыв. Оцениваемый в 3,59 миллиарда долларов в 2025 году, рынок, согласно прогнозам, достигнет 23,18 миллиарда долларов к 2034 году при среднегодовом темпе роста (CAGR) 22,9 %. Другой прогноз указывает на достижение 7,48 миллиарда долларов к 2026 году и 52,41 миллиарда долларов к 2035 году с ежегодным ростом 24,16 %.
Но кто получает эту выгоду? В настоящее время централизованные платформы извлекают прибыль, в то время как создатели данных получают нулевую компенсацию. Шум в разметке, непоследовательные теги и отсутствие контекста увеличивают расходы, но у участников нет стимулов для повышения качества. Проблемы конфиденциальности данных затрагивают 28 % компаний, ограничивая доступность датасетов именно тогда, когда ИИ остро нуждается в разнообразных и высококачественных входных данных.
Ocean Protocol: токенизация экономики данных объемом 100 миллионов долларов
Ocean Protocol решает вопрос владения, позволяя поставщикам данных токенизировать свои наборы данных и делать их доступными для обучения ИИ без потери контроля. С момента запуска Ocean Nodes в августе 2024 года сеть выросла до более чем 1,4 миллиона нод в 70+ странах, интегрировала более 35 000 наборов данных и обеспечила транзакции с данными, связанными с ИИ, на сумму более 100 миллионов долларов.
Дорожная карта продукта на 2025 год включает три критически важных компонента:
Конвейеры инференса (Inference Pipelines) позволяют осуществлять сквозное обучение и развертывание моделей ИИ непосредственно в инфраструктуре Ocean. Поставщики данных токенизируют проприетарные наборы данных, устанавливают цены и получают доход каждый раз, когда модель ИИ использует их данные для обучения или вывода.
Ocean Enterprise Onboarding переводит бизнес-экосистемы от пилотных проектов к полноценному производству. Ocean Enterprise v1, запуск которой намечен на 3 квартал 2025 года, представляет собой соответствующую нормативным требованиям и готовую к эксплуатации платформу данных, ориентированную на институциональных клиентов, которым необходим аудируемый обмен данными с сохранением конфиденциальности.
Аналитика нод (Node Analytics) внедряет информационные панели для отслеживания производительности, использования и ROI. Партнеры, такие как NetMind, предоставляют 2 000 GPU, а Aethir помогает масштабировать ноды Ocean для поддержки больших рабочих нагрузок ИИ, создавая децентрализованный вычислительный уровень для обучения ИИ.
Механизм распределения доходов Ocean работает через смарт-контракты: поставщики данных устанавливают условия доступа, разработчики ИИ платят за использование, а блокчейн автоматически распределяет платежи всем участникам. Это превращает данные из разовой продажи в непрерывный поток доходов, привязанный к производительности модели.