Перейти к основному контенту

Невидимый налог: как ИИ эксплуатирует прозрачность блокчейна

· 9 мин чтения
Dora Noda
Software Engineer

Каждую секунду системы ИИ по всему миру собирают терабайты общедоступных данных блокчейна — историю транзакций, взаимодействия со смарт-контрактами, поведение кошельков, потоки протоколов DeFi — и превращают эту необработанную информацию в аналитические продукты стоимостью в миллиарды долларов. Парадокс поразителен: основополагающая приверженность Web3 прозрачности и открытым данным стала тем самым механизмом, который позволяет компаниям в сфере ИИ извлекать огромную ценность, не платя в ответ ни единой комиссии за газ.

Это невидимый налог, который ИИ накладывает на криптоэкосистему, и он меняет экономику децентрализации способами, которые большинство разработчиков еще не осознали.

Проблема асимметричного извлечения

Публичные блокчейны работают на простом допущении: каждая транзакция, каждый вызов смарт-контракта, каждый перевод токенов видимы любому желающему. Эта прозрачность была разработана для обеспечения бездоверительной проверки и общественного надзора. Но компании, занимающиеся ИИ, обнаружили то, чего не предвидели оригинальные шифропанки: эти открытые данные также являются идеальной тренировочной площадкой для моделей машинного обучения стоимостью в миллиарды долларов.

Рассмотрим масштабы: Nansen, ведущая платформа ончейн-аналитики, пометила более 500 миллионов адресов кошельков с учетом паттернов поведения. Messari предоставляет анализ настроений на базе ИИ во всей экосистеме DeFi. Chainalysis и Elliptic построили многомиллиардные бизнесы на мониторинге блокчейна. Эти компании — и модели ИИ, которые они обучают — извлекают огромную ценность из данных, которые пользователи и протоколы создали за счет собственных комиссий за транзакции и вычислительных ресурсов.

Цифры говорят сами за себя. Рынок блокчейн-ИИ вырос с 570 миллионов долларов в 2024 году до 700 миллионов долларов в 2025 году, и, по прогнозам, достигнет 1,88 миллиарда долларов к 2029 году при совокупном среднегодовом темпе роста (CAGR) более 23%. Между тем, ожидается, что рынок веб-скрейпинга на базе ИИ достигнет 4,37 миллиарда долларов к 2035 году. Большая часть этого роста подпитывается свободно доступными данными блокчейна, получение которых не стоило экстракторам ничего.

Что ИИ на самом деле забирает у Web3

Извлечение стоимости происходит в нескольких измерениях, которых большинство криптопользователей никогда не видят.

Аналитика паттернов транзакций: Каждый своп на Uniswap, каждая корректировка кредитного плеча на GMX, каждая ставка на NFT на OpenSea вносят вклад в наборы данных о поведении, которые модели ИИ используют для прогнозирования рыночных движений. Когда аналитическая фирма идентифицирует кошелек «умных денег», накапливающий определенный токен, она монетизирует инсайты, полученные из коллективной истории транзакций, за создание которой пользователи платили газ.

Динамика протоколов DeFi: Модели машинного обучения, обученные на изменениях TVL протоколов, паттернах ликвидации и стратегиях доходного фермерства, создают инструменты прогнозирования, за доступ к которым институциональные трейдеры платят щедрые суммы. DeFiLlama агрегирует исчерпывающие данные почти по всем релевантным сетям — данные, на генерацию которых ушли миллиарды долларов в разработку протоколов.

Поведение смарт-контрактов: Системы ИИ анализируют взаимодействия со смарт-контрактами для выявления уязвимостей, прогнозирования возможностей оптимизации газа и моделирования паттернов поведения пользователей. Эта аналитика подпитывает стратегии извлечения MEV, которые напрямую забирают ценность у обычных пользователей.

Кластеризация кошельков и идентификация: Несмотря на псевдонимную природу блокчейна, разрешение сущностей (entity resolution) на базе ИИ может связывать адреса, идентифицировать институциональных игроков и создавать базы данных профилей, которые активно монетизируются торговыми фирмами и комплаенс-компаниями.

Парадокс токеномики

И вот здесь ситуация становится философски неудобной для приверженцев криптоиндустрии. Блокчейн-сети полагаются на токеномику — тщательно разработанные структуры стимулов, предназначенные для фиксации стоимости участниками, которые вносят вклад в сеть. Валидаторы стейкают токены и получают вознаграждения. Провайдеры ликвидности вносят активы и зарабатывают комиссии. Пользователи платят газ и получают полезность бездоверительных транзакций.

Но извлечение данных ИИ находится полностью за пределами этих экономических циклов. Когда ИИ-компания сканирует историю транзакций Ethereum за годы для обучения торговой модели, она ничего не вносит в бюджет безопасности сети. Когда аналитические платформы индексируют каждый блок Solana для работы своих продуктов, SOL не возвращается валидаторам или стейкерам.

Это создает проблему безбилетника в огромном масштабе. Системы ИИ извлекают выгоду из безопасности, целостности данных и сетевых эффектов, которые поддерживают держатели токенов и валидаторы, не участвуя ни в одном из экономических механизмов, предназначенных для их поддержания. Это эквивалентно строительству торгового центра в районе и отказу от уплаты налогов на недвижимость при использовании дорог, полиции и инфраструктуры, которые финансируются за счет этих налогов.

Асимметрия со временем только усугубляется. По мере того как модели ИИ становятся более совершенными в извлечении «альфы» из данных блокчейна, они создают торговые стратегии, которые часто забирают ценность у менее информированных участников. Та самая прозрачность, которая делает блокчейн надежным, превращается в оружие, используемое против сообщества, которое его создало.

Правовой вакуум и вопрос авторского права

Традиционные системы интеллектуальной собственности здесь практически бессильны. Кому «принадлежит» запись транзакции? Отправителю? Получателю? Валидаторам, которые её обработали? Протоколу, который этому способствовал?

С юридической точки зрения ответ обычно таков: никому — или всем, что, по сути, одно и то же. В отличие от фотографий, статей или программного кода, транзакции в блокчейне не создаются одним автором, выражающим творческий замысел. Это операционные записи, а операционные записи обычно не подлежат защите авторским правом.

Это резко контрастирует с битвами, которые ведутся в традиционном технологическом секторе. The New York Times подала в суд на OpenAI и Microsoft за обучение моделей на новостных статьях без разрешения. Reddit заключил платную сделку с Google на предоставление контента для обучения моделей. Stack Overflow стал партнером OpenAI для интеграции знаний разработчиков в сервисы искусственного интеллекта. Эти создатели контента имеют юридические рычаги влияния, которых просто нет у генераторов данных в блокчейне.

Некоторые проекты пытаются создать решения на базе блокчейна. Fox Corp. запустила Verify — платформу для отслеживания использования онлайн-контента. Фреймворк IBIS предлагает реестры метаданных наборов данных (Dataset Metadata Registries) для соблюдения авторских прав в сфере ИИ. Но эти системы требуют добровольного участия и механизмов принуждения, которых не существует для уже публичных данных блокчейна.

Новые решения: проекты по обеспечению суверенитета данных

Криптоэкосистема не была полностью слепа к этой проблеме. Несколько проектов создают инфраструктуру, специально разработанную для того, чтобы пользователи могли контролировать и монетизировать свои данные.

Vana стала ведущим решением, обрабатывающим данные более 1 миллиона участников с помощью технологии, созданной в стенах MIT. Пользователи загружают данные в зашифрованные цифровые кошельки и сохраняют пропорциональное право собственности на любые модели ИИ, обученные на их вкладе. Каждый раз, когда используется модель, участники получают вознаграждение в зависимости от того, насколько их данные помогли её обучить.

Ocean Protocol управляет децентрализованной биржей данных на Ethereum, где потребители и поставщики данных могут торговать наборами данных без ущерба для конфиденциальности. Нативный токен протокола облегчает транзакции на открытом рынке активов данных.

Sahara позиционирует себя как «AI-native блокчейн», кодирующий наборы данных, модели и агентов с помощью метаданных для атрибуции, версионности, лицензирования и правил доступа — всё это закреплено в блокчейне для обеспечения проверяемых прав с течением времени.

CARV Protocol и подобные проекты позволяют пользователям становиться владельцами собственных данных и получать доход через «токенизацию данных», создавая экономические циклы, которых сейчас не хватает процессу извлечения данных из блокчейна.

Эти решения имеют общую архитектуру: идентификация, разрешения и лицензирование закреплены в блокчейне, в то время как тяжелые вычисления происходят вне сети по верифицируемым протоколам. Это прагматичное признание того, что невозможно запустить инференс трансформеров непосредственно в блокчейне, но можно отслеживать, кто и какой вклад вносит, и обеспечивать справедливое вознаграждение.

Инфраструктурный разрыв

Более глубокая проблема носит архитектурный характер. Публичные блокчейны были разработаны для верификации, а не для контроля доступа. Каждая полная нода хранит полную копию истории сети. Каждый блокчейн-эксплорер делает эту историю доступной для просмотра. Каждый RPC-эндпоинт обеспечивает программный доступ к данным.

Этого уже не вернуть. Даже если будущие архитектуры блокчейнов будут включать механизмы лицензирования данных, существующие терабайты истории транзакций Ethereum, Bitcoin и Solana остаются постоянно доступными. Любая ИИ-компания с достаточным объемом хранилища и вычислительных мощностей может обучаться на этих данных, независимо от того, какие новые протоколы разработает сообщество.

Это создает интересную стратегическую задачу для разработчиков блокчейнов. Будущие сети могут внедрять настройки конфиденциальности по умолчанию, где детали транзакций зашифрованы и раскрываются выборочно для аудита или аналитики. Но это прямо противоречит ценностям прозрачности, которые изначально сделали блокчейн надежным.

Некоторые проекты изучают промежуточные варианты. Oasis Network и подобные платформы конфиденциальных вычислений используют TEE (Trusted Execution Environments) для обработки зашифрованных данных без их раскрытия операторам. Доказательства с нулевым разглашением могут подтверждать валидность транзакции, не раскрывая её деталей. Эти технологии теоретически могут создать блокчейны, где извлечение данных станет технически сложным, но ценой открытой проверяемости, которая определяет ценностное предложение криптовалют.

Что это значит для проектирования токеномики

Дальновидные разработчики протоколов начинают закладывать экономику данных в свою токеномику с самого начала.

Концепция «Data Shapley Value» (значение Шепли для данных) — метод измерения того, насколько каждая точка данных влияет на производительность модели — может быть реализована в блокчейне для создания механизмов справедливого вознаграждения. Протоколы могут требовать от ИИ-систем стейкинга токенов пропорционально объему данных, к которым они обращаются, с условиями слэшинга за эксплуататорское поведение.

Более радикально: некоторые теоретики предлагают блокчейн-сетям рассматривать свои совокупные данные как коллективный актив, где любое коммерческое использование требует лицензионных отчислений, которые возвращаются валидаторам, стейкерам и активным пользователям. Это превратило бы «невидимый налог» в явный поток доходов.

Проблемы значительны. Принудительное исполнение в разных юрисдикциях практически невозможно. Определение ценности конкретных точек данных остается вычислительно затратным. А любые ограничения доступа рискуют фрагментировать открытую экосистему, которая и придает данным блокчейнов их аналитическую ценность.

Грядущая расплата

Напряжение между философией открытых данных Web3 и экстрактивной экономикой ИИ не исчезает — оно усиливается. По мере того как модели ИИ становятся более мощными, а данные — более ценными, экономическая асимметрия будет только расти.

Финансирование децентрализованных ИИ-стартапов подскочило на 162 % в годовом исчислении до $ 8,78 млрд, при этом Web3 ИИ-проекты привлекли 11 % от общего объема венчурных инвестиций в блокчейн. Эти проекты представляют собой попытку криптоэкосистемы создать альтернативы — системы, в которых поставщики данных участвуют в распределении стоимости, создаваемой их вкладом.

Но время на исходе. Каждый прошедший день добавляет больше истории транзакций в публичный реестр и больше обучающих данных для систем ИИ, которые ничего не отдают взамен. Протоколы, которым не удастся решить проблему этого извлечения ресурсов, увидят, как их сетевые эффекты подпитывают продукты конкурентов, в то время как их собственные держатели токенов несут расходы.

Невидимый налог может быть невидимым, но его последствия становятся все более реальными. Вопрос не в том, решит ли криптоиндустрия эту проблему, а в том, успеет ли она это сделать до того, как извлечение данных станет постоянной инфраструктурой в экономике ИИ.


Конвергенция ИИ и блокчейна поднимает фундаментальные вопросы о владении данными, извлечении стоимости и экономике открытых систем. Для разработчиков, ориентирующихся в этой среде, выбор инфраструктуры важен как никогда. BlockEden.xyz предоставляет надежный доступ к блокчейн-API для разработчиков, создающих следующее поколение Web3-приложений, осознанно работающих с данными.