Перейти к основному контенту

Рынки данных встречают обучение ИИ: как блокчейн решает кризис ценообразования данных на 23 миллиарда долларов

· 15 мин чтения
Dora Noda
Software Engineer

Индустрия ИИ столкнулась с парадоксом: глобальный объем производства данных вырастет с 33 зеттабайт до 175 зеттабайт к 2025 году, однако качество моделей ИИ стагнирует. Проблема не в дефиците данных, а в том, что у поставщиков данных нет возможности извлекать выгоду из своего вклада. На сцену выходят блокчейн-рынки данных, такие как Ocean Protocol, LazAI и ZENi, которые превращают данные для обучения ИИ из бесплатного ресурса в монетизируемый класс активов, стоимость которого к 2034 году достигнет 23,18 миллиарда долларов.

Проблема ценообразования данных на 23 миллиарда долларов

Затраты на обучение ИИ выросли на 89 % в период с 2023 по 2025 год, при этом сбор и разметка данных поглощают до 80 % бюджетов проектов по машинному обучению. Тем не менее, создатели данных — обычные люди, генерирующие поисковые запросы, взаимодействия в социальных сетях и поведенческие паттерны — не получают ничего, в то время как технологические гиганты извлекают миллиардную прибыль.

Рынок наборов данных для обучения ИИ наглядно демонстрирует этот разрыв. Оцениваемый в 3,59 миллиарда долларов в 2025 году, рынок, согласно прогнозам, достигнет 23,18 миллиарда долларов к 2034 году при среднегодовом темпе роста (CAGR) 22,9 %. Другой прогноз указывает на достижение 7,48 миллиарда долларов к 2026 году и 52,41 миллиарда долларов к 2035 году с ежегодным ростом 24,16 %.

Но кто получает эту выгоду? В настоящее время централизованные платформы извлекают прибыль, в то время как создатели данных получают нулевую компенсацию. Шум в разметке, непоследовательные теги и отсутствие контекста увеличивают расходы, но у участников нет стимулов для повышения качества. Проблемы конфиденциальности данных затрагивают 28 % компаний, ограничивая доступность датасетов именно тогда, когда ИИ остро нуждается в разнообразных и высококачественных входных данных.

Ocean Protocol: токенизация экономики данных объемом 100 миллионов долларов

Ocean Protocol решает вопрос владения, позволяя поставщикам данных токенизировать свои наборы данных и делать их доступными для обучения ИИ без потери контроля. С момента запуска Ocean Nodes в августе 2024 года сеть выросла до более чем 1,4 миллиона нод в 70+ странах, интегрировала более 35 000 наборов данных и обеспечила транзакции с данными, связанными с ИИ, на сумму более 100 миллионов долларов.

Дорожная карта продукта на 2025 год включает три критически важных компонента:

Конвейеры инференса (Inference Pipelines) позволяют осуществлять сквозное обучение и развертывание моделей ИИ непосредственно в инфраструктуре Ocean. Поставщики данных токенизируют проприетарные наборы данных, устанавливают цены и получают доход каждый раз, когда модель ИИ использует их данные для обучения или вывода.

Ocean Enterprise Onboarding переводит бизнес-экосистемы от пилотных проектов к полноценному производству. Ocean Enterprise v1, запуск которой намечен на 3 квартал 2025 года, представляет собой соответствующую нормативным требованиям и готовую к эксплуатации платформу данных, ориентированную на институциональных клиентов, которым необходим аудируемый обмен данными с сохранением конфиденциальности.

Аналитика нод (Node Analytics) внедряет информационные панели для отслеживания производительности, использования и ROI. Партнеры, такие как NetMind, предоставляют 2 000 GPU, а Aethir помогает масштабировать ноды Ocean для поддержки больших рабочих нагрузок ИИ, создавая децентрализованный вычислительный уровень для обучения ИИ.

Механизм распределения доходов Ocean работает через смарт-контракты: поставщики данных устанавливают условия доступа, разработчики ИИ платят за использование, а блокчейн автоматически распределяет платежи всем участникам. Это превращает данные из разовой продажи в непрерывный поток доходов, привязанный к производительности модели.

LazAI: верифицируемые данные взаимодействия с ИИ на Metis

LazAI предлагает фундаментально иной подход — монетизацию данных взаимодействия с ИИ, а не просто статических наборов данных. Каждая беседа с флагманскими агентами LazAI (Lazbubu, SoulTarot) генерирует токены привязки данных (Data Anchoring Tokens, DAT), которые функционируют как отслеживаемые и проверяемые записи выходных данных, созданных ИИ.

Альфа-версия основной сети (Alpha Mainnet) была запущена в декабре 2025 года на инфраструктуре корпоративного уровня с использованием консенсуса QBFT и расчетов на базе $METIS. DAT позволяют токенизировать и монетизировать наборы данных и модели ИИ как верифицируемые активы с прозрачным правом собственности и распределением доходов.

Почему это важно? Традиционное обучение ИИ использует статические наборы данных, зафиксированные в момент сбора. LazAI фиксирует динамические данные взаимодействия — запросы пользователей, ответы моделей, циклы уточнения — создавая обучающие наборы данных, которые отражают реальные паттерны использования. Эти данные экспоненциально более ценны для тонкой настройки моделей, поскольку они содержат сигналы обратной связи от человека, встроенные в поток диалога.

Система включает три ключевые инновации:

Стейкинг валидаторов Proof-of-Stake обеспечивает безопасность конвейеров данных ИИ. Валидаторы стейкают токены для подтверждения целостности данных, получая вознаграждения за точную проверку и подвергаясь штрафам за одобрение фальсифицированных данных.

Минтинг DAT с распределением доходов позволяет пользователям, генерирующим ценные данные взаимодействия, минтить токены DAT, представляющие их вклад. Когда ИИ-компании покупают эти наборы данных для обучения моделей, доход автоматически распределяется между всеми держальцами DAT пропорционально их вкладу.

Управление через iDAO создает децентрализованные коллективы ИИ, где участники, предоставляющие данные, совместно управляют курированием датасетов, стратегиями ценообразования и стандартами качества через ончейн-голосование.

Дорожная карта на 2026 год предусматривает внедрение конфиденциальности на базе ZK (пользователи смогут монетизировать данные взаимодействия, не раскрывая личную информацию), децентрализованные рынки вычислений (обучение происходит на распределенной инфраструктуре, а не в централизованных облаках) и оценку мультимодальных данных (взаимодействие с видео, аудио и изображениями помимо текста).

ZENi: Интеллектуальный уровень данных для ИИ-агентов

ZENi работает на стыке Web3 и ИИ, обеспечивая работу «экономики InfoFi» — децентрализованной сети, соединяющей традиционную и блокчейн-коммерцию через интеллект на базе ИИ. Компания привлекла 1,5 млн $ в рамках сид-раунда под руководством Waterdrip Capital и Mindfulness Capital.

В основе лежит уровень данных InfoFi — высокопроизводительный движок поведенческого интеллекта, обрабатывающий более 1 миллиона сигналов ежедневно в X / Twitter, Telegram, Discord и ончейн-активности. ZENi выявляет паттерны в поведении пользователей, изменения настроений и вовлеченность сообщества — данные, которые критически важны для обучения ИИ-агентов, но которые сложно собирать в больших масштабах.

Платформа функционирует как система из трех частей:

AI Data Analytic Agent (Агент по анализу данных ИИ) выявляет аудитории с высокими намерениями и кластеры влияния, анализируя социальные графы, ончейн-транзакции и показатели вовлеченности. Это создает наборы поведенческих данных, показывающие не только то, что делают пользователи, но и почему они принимают решения.

AIGC Agent (Агент для генерации контента ИИ) создает персонализированные кампании, используя инсайты из уровня данных. Понимая предпочтения пользователей и динамику сообщества, агент генерирует контент, оптимизированный для конкретных сегментов аудитории.

AI Execution Agent (Агент по исполнению ИИ) активирует охват через dApp ZENi, замыкая цикл от сбора данных до монетизации. Пользователи получают вознаграждение, когда их поведенческие данные способствуют успеху кампаний.

ZENi уже обслуживает партнеров в сфере электронной коммерции, гейминга и Web3, имея 480 000 зарегистрированных пользователей и 80 000 активных пользователей в день. Бизнес-модель монетизирует поведенческий интеллект: компании платят за доступ к наборам данных, обработанным ИИ ZENi, а доход поступает пользователям, чьи данные послужили основой для этих инсайтов.

Конкурентное преимущество блокчейна на рынках данных

Почему блокчейн важен для монетизации данных? Три технические возможности делают децентрализованные рынки данных превосходящими централизованные альтернативы:

Гранулярная атрибуция доходов Смарт-контракты позволяют реализовать сложное распределение доходов, при котором несколько участников, внесших вклад в модель ИИ, автоматически получают пропорциональное вознаграждение в зависимости от использования. Один обучающий набор данных может объединять входные данные от 10 000 пользователей — блокчейн отслеживает каждый вклад и распределяет микроплатежи за каждый вывод модели.

Традиционные системы не справляются с такой сложностью. Платежные системы взимают фиксированные комиссии (2–3%), что неприемлемо для микроплатежей, а централизованным платформам не хватает прозрачности в отношении вклада участников. Блокчейн решает обе проблемы: почти нулевые транзакционные издержки благодаря решениям второго уровня (Layer 2) и неизменяемая атрибуция через ончейн-происхождение (provenance).

Проверяемое происхождение данных Токены привязки данных (Data Anchoring Tokens) от LazAI доказывают происхождение данных без раскрытия основного контента. ИИ-компании, обучающие модели, могут убедиться, что они используют лицензированные, высококачественные данные, а не парсинг веб-контента сомнительной законности.

Это устраняет критический риск: правила конфиденциальности данных влияют на 28% компаний, ограничивая доступность наборов данных. Рынки данных на базе блокчейна внедряют проверку с сохранением конфиденциальности — подтверждают качество данных и лицензирование без раскрытия личной информации.

Децентрализованное обучение ИИ Сеть узлов Ocean Protocol демонстрирует, как распределенная инфраструктура снижает затраты. Вместо того чтобы платить облачным провайдерам 2–5 $ за час работы GPU, децентрализованные сети сопоставляют неиспользуемые вычислительные мощности (игровые ПК, дата-центры со свободной мощностью) со спросом на обучение ИИ, обеспечивая снижение стоимости на 50–85%.

Блокчейн координирует этот сложный процесс с помощью смарт-контрактов, регулирующих распределение задач, выплату вознаграждений и проверку качества. Участники стейкают токены, чтобы присоединиться к сети, получая награды за честные вычисления и подвергаясь слэшингу за предоставление неверных результатов.

Путь к 52 миллиардам долларов: рыночные силы, стимулирующие внедрение

Три сходящихся тренда ускоряют рост рынка данных на блокчейне к прогнозируемым 52,41 млрд $ к 2035 году:

Диверсификация моделей ИИ Эра массивных базовых моделей (GPT-4, Claude, Gemini), обученных на всем тексте интернета, подходит к концу. Специализированные модели для здравоохранения, финансов, юридических услуг и вертикальных приложений требуют наборов данных в конкретных областях, которые централизованные платформы не курируют.

Рынки данных на блокчейне преуспевают в работе с нишевыми наборами данных. Поставщик медицинских изображений может токенизировать рентгеновские снимки с диагностическими аннотациями, установить условия использования, требующие согласия пациента, и получать доход от каждой модели ИИ, обученной на этих данных. Это невозможно реализовать на централизованных платформах, которым не хватает детального контроля доступа и атрибуции.

Регуляторное давление Правила конфиденциальности данных (GDPR, CCPA, Закон Китая о защите личной информации) предписывают сбор данных на основе согласия. Рынки на базе блокчейна реализуют согласие как программируемую логику — пользователи криптографически подписывают разрешения, доступ к данным возможен только на определенных условиях, а смарт-контракты автоматически обеспечивают соблюдение требований.

Ориентированность Ocean Enterprise v1 на комплаенс напрямую решает эту задачу. Финансовым учреждениям и поставщикам медицинских услуг необходима проверяемая цепочка данных (lineage), доказывающая, что каждый набор данных, используемый для обучения моделей, имел надлежащее лицензирование. Блокчейн обеспечивает неизменяемые аудиторские следы, удовлетворяющие нормативным требованиям.

Качество важнее количества Недавние исследования показывают, что ИИ не нуждается в бесконечных обучающих данных, когда системы больше напоминают биологический мозг. Это смещает стимулы с сбора максимального объема данных на курирование высококачественных входных данных.

Децентрализованные рынки данных правильно выстраивают стимулы: создатели данных зарабатывают больше за высококачественный вклад, потому что разработчики моделей платят премиальные цены за наборы данных, улучшающие производительность. Интерактивные данные LazAI фиксируют сигналы обратной связи от людей (какие запросы уточняются, какие ответы удовлетворяют пользователей), которые упускают статические наборы данных, что делает их по определению более ценными в расчете на каждый байт.

Вызовы: Конфиденциальность, ценообразование и войны протоколов

Несмотря на положительную динамику, рынки блокчейн-данных сталкиваются со структурными проблемами:

Парадокс конфиденциальности Обучение ИИ требует прозрачности данных (моделям нужен доступ к реальному контенту), но правила конфиденциальности требуют минимизации данных. Текущие решения, такие как федеративное обучение (обучение на зашифрованных данных), увеличивают затраты в 3–5 раз по сравнению с централизованным обучением.

Доказательства с нулевым разглашением (Zero-knowledge proofs) предлагают путь вперед — подтверждение качества данных без раскрытия их содержания — но создают дополнительные вычислительные накладные расходы. Дорожная карта ZK от LazAI на 2026 год направлена на решение этой проблемы, хотя внедрение готовых к эксплуатации решений ожидается через 12–18 месяцев.

Процесс ценообразования Сколько стоит взаимодействие в социальных сетях? А медицинское изображение с диагностической аннотацией? Рынкам блокчейна не хватает устоявшихся механизмов ценообразования для новых типов данных.

Подход Ocean Protocol — позволить поставщикам устанавливать цены, а рыночной динамике определять стоимость — работает для стандартизированных наборов данных, но с трудом применим к уникальным проприетарным данным. Рынки предсказаний или динамическое ценообразование на базе ИИ могут решить эту проблему, хотя оба варианта вносят зависимость от оракулов (внешних ценовых каналов), что подрывает децентрализацию.

Фрагментация совместимости Ocean Protocol работает на Ethereum, LazAI — на Metis, ZENi интегрируется с несколькими сетями. Данные, токенизированные на одной платформе, не могут быть легко перенесены на другую, что фрагментирует ликвидность.

Кроссчейн-мосты и универсальные стандарты данных (такие как децентрализованные идентификаторы для наборов данных) могли бы решить эту проблему, но экосистема все еще находится на ранней стадии развития. Рост рынка блокчейн-ИИ с $680,89 млн в 2025 году до $4,338 млрд к 2034 году предполагает, что до консолидации вокруг победивших протоколов еще несколько лет.

Что это значит для разработчиков

Для команд, создающих приложения ИИ, блокчейн-рынки данных предлагают три непосредственных преимущества:

Доступ к проприетарным наборам данных Более 35 000 наборов данных Ocean Protocol включают проприетарные данные для обучения, недоступные через традиционные каналы. Медицинская визуализация, финансовые транзакции, поведенческая аналитика из приложений Web3 — специализированные наборы данных, которые централизованные платформы не курируют.

Инфраструктура, готовая к соблюдению нормативных требований Встроенное лицензирование, управление согласием и контрольные журналы Ocean Enterprise v1 решают регуляторные проблемы. Вместо создания собственных систем управления данными разработчики получают комплаенс «по умолчанию» через смарт-контракты, обеспечивающие соблюдение условий использования данных.

Снижение затрат Децентрализованные вычислительные сети снижают затраты облачных провайдеров на 50–85% для задач пакетного обучения. Партнерство Ocean с NetMind (2 000 графических процессоров) и Aethir демонстрирует, как токенизированные рынки GPU сопоставляют спрос и предложение по более низкой цене, чем AWS/GCP/Azure.

BlockEden.xyz предоставляет RPC-инфраструктуру корпоративного уровня для приложений ИИ на базе блокчейна. Независимо от того, строите ли вы на Ethereum (Ocean Protocol), Metis (LazAI) или мультичейн-платформах, наши надежные нод-сервисы обеспечат бесперебойную работу и производительность ваших конвейеров данных ИИ. Изучите наш маркетплейс API, чтобы подключить ваши системы ИИ к блокчейн-сетям, созданным для масштабирования.

Точка перелома 2026 года

Три катализатора позиционируют 2026 год как переломный для рынков блокчейн-данных:

Запуск промышленной версии Ocean Enterprise v1 (3 кв. 2025 г.) Запуск первого соответствующего требованиям маркетплейса данных институционального уровня. Если Ocean займет хотя бы 5% рынка наборов данных для обучения ИИ объемом $7,48 млрд в 2026 году, это составит $374 млн транзакций данных, проходящих через блокчейн-инфраструктуру.

Внедрение ZK-конфиденциальности LazAI (2026) Доказательства с нулевым разглашением позволяют пользователям монетизировать данные о взаимодействии без ущерба для конфиденциальности. Это открывает путь к массовому внедрению — сотни миллионов пользователей социальных сетей, поисковых запросов и сессий электронной коммерции смогут монетизироваться через DAT (токены доступа к данным).

Интеграция федеративного обучения Федеративное обучение ИИ позволяет обучать модели без централизации данных. Блокчейн добавляет атрибуцию ценности: вместо того чтобы Google обучал модели на данных пользователей Android без компенсации, федеративные системы, работающие на блокчейне, распределяют доход между всеми поставщиками данных.

Эта конвергенция означает, что обучение ИИ переходит от модели «собирать все данные, обучать централизованно, ничего не платить» к модели «обучать на распределенных данных, вознаграждать участников, проверять происхождение». Блокчейн не просто способствует этому переходу — это единственный технологический стек, способный координировать миллионы поставщиков данных с автоматическим распределением доходов и криптографической проверкой.

Заключение: Данные становятся программируемыми

Рост рынка данных для обучения ИИ с $3,59 млрд в 2025 году до $23–52 млрд к 2034 году представляет собой нечто большее, чем просто расширение рынка. Это фундаментальный сдвиг в том, как мы оцениваем информацию.

Ocean Protocol доказывает, что данные могут быть токенизированы, оценены и проданы как финансовые активы при сохранении контроля со стороны поставщика. LazAI демонстрирует, что данные о взаимодействии с ИИ, которые ранее считались мимолетными, становятся ценными входными данными для обучения при правильном сборе и проверке. ZENi показывает, что поведенческий интеллект можно извлекать, обрабатывать с помощью ИИ и монетизировать через децентрализованные рынки.

Вместе эти платформы превращают данные из сырья, добываемого технологическими гигантами, в программируемый класс активов, где создатели получают выгоду. Глобальный взрыв объема данных с 33 до 175 зеттабайт имеет значение только в том случае, если качество побеждает количество — и рынки на базе блокчейна согласовывают стимулы для вознаграждения качественного вклада.

Когда создатели данных получают доход, пропорциональный их вкладу, когда ИИ-компании платят справедливую цену за качественные входные данные, и когда смарт-контракты автоматизируют распределение вознаграждений между миллионами участников, мы не просто решаем проблему ценообразования данных. Мы строим экономику, в которой информация имеет внутреннюю ценность, происхождение поддается проверке, а участники наконец-то получают богатство, которое генерируют их данные.

Это не рыночный тренд. Это смена парадигмы — и она уже происходит в блокчейне.