Гамбит Ambient на 7,2 млн долларов: как Proof of Logits может заменить майнинг на основе хэшей инференсом ИИ
Что если бы та же вычислительная работа, которая обеспечивает безопасность блокчейна, также обучала следующее поколение моделей ИИ? Это не далекое видение — это основная идея проекта Ambient, форка Solana, который только что привлек $7.2 млн от a16z CSX для создания первого в мире блокчейна на базе proof-of-work с использованием ИИ.
Традиционный proof-of-work сжигает электроэнергию на решение произвольных криптографических головоломок. Майнеры биткоина соревнуются в поиске хешей с достаточным количеством ведущих нулей — это вычислительная работа, не имеющая ценности помимо безопасности сети. Ambient полностью меняет этот сценарий. Его механизм консенсуса Proof of Logits (PoL) заменяет «перебор» хешей на инференс, дообучение и обучение моделей ИИ. Майнеры не решают головоломки; они генерируют проверяемые результаты работы ИИ. Валидаторы не пересчитывают весь объем работы; они проверяют криптографические «отпечатки», называемые логитами.
Результат? Блокчейн, в котором безопасность и развитие ИИ экономически согласованы, где накладные расходы на верификацию в 0.1% делают проверку консенсуса почти бесплатной, а стоимость обучения снижается в 10 раз по сравнению с централизованными альтернативами. В случае успеха Ambient может дать ответ на одну из старейших претензий к криптоиндустрии — о том, что proof-of-work тратит ресурсы впустую — превратив майнинг в продуктивный труд ИИ.
П рорыв Proof of Logits: проверяемый ИИ без повторных вычислений
Для понимания PoL необходимо разобраться, что такое логиты (logits). Когда большие языковые модели генерируют текст, они не выдают слова напрямую. Вместо этого на каждом этапе они создают распределение вероятностей по всему словарю — числовые значения, представляющие уровень уверенности для каждого возможного следующего токена.
Эти значения называются логитами. Для модели со словарем в 50 000 токенов генерация одного слова означает вычисление 50 000 логитов. Эти числа служат уникальным вычислительным отпечатком. Только конкретная модель с конкретными весами, обрабатывающая конкретные входные данные, выдает определенное распределение логитов.
Инновация Ambient заключается в использовании логитов в качестве proof-of-work: майнеры выполняют инфере нс ИИ (генерируют ответы на промпты), а валидаторы проверяют эту работу, сверяя отпечатки логитов вместо повторного выполнения всех вычислений.
Вот как работает процесс верификации:
Майнер генерирует результат: Майнер получает промпт (например, «Обобщите принципы блокчейн-консенсуса») и использует модель с 600 миллиардами параметров для генерации ответа из 4 000 токенов. Это создает 4 000 × 50 000 = 200 миллионов логитов.
Валидатор проводит выборочную проверку: Вместо повторной генерации всех 4 000 токенов валидатор случайным образом выбирает одну позицию — например, токен №2 847. Валидатор запускает один шаг инференса в этой позиции и сравнивает логиты, предоставленные майнером, с ожидаемым распределением.
Криптографическое обязательство: Если логиты совпадают (в пределах допустимого порога, учитывающего точность вычислений с плавающей запятой), работа майнера считается подтвержденной. Если нет — блок отклоняется, а майнер лишается вознаграждения.
Это снижает накладные расходы на верификацию примерно до 0.1% от исходных вычислений. Валидатору, проверяющему 200 мил лионов логитов, нужно верифицировать только 50 000 логитов (позицию одного токена), что сокращает затраты на 99.9%. Сравните это с традиционным PoW, где валидация означает повторный запуск всей хеш-функции, или с подходом биткоина, где проверка одного хеша SHA-256 тривиальна, так как сама головоломка произвольна.
Система Ambient экспоненциально дешевле, чем наивные схемы «доказательства полезной работы» (proof of useful work), требующие полного пересчета. Она ближе к эффективности биткоина (дешевая валидация), но приносит реальную пользу (инференс ИИ вместо бессмысленных хешей).
Снижение стоимости обучения в 10 раз: децентрализованный ИИ без монополии дата-центров
Централизованное обучение ИИ обходится дорого — для большинства организаций это неподъемные суммы. Обучение моделей масштаба GPT-4 стоит десятки миллионов долларов, требует тысяч промышленных GPU и концентрирует власть в руках нескольких технологических гигантов. Архитектура Ambient направлена на демократизацию этого процесса путем распределения обучения по сети независимых майнеров.
Снижение стоимости в 10 раз достигается благодаря двум техническим инновациям:
Шардинг в стиле PETALS: Ambient адаптирует методы PETALS, децентрализованной системы инференса, где каждый узел хранит только шард (фрагмент) большой модели. Вместо того чтобы требовать от майнеров наличия всей модели на 600 миллиардов параметров (что потребовало бы терабайты VRAM), каждый майнер владеет подмножеством слоев. Промпт проходит через сеть последовательно: каждый майнер обрабатывает свой шард и передает активации следующему.
Это означает, что майнер с одной потребительской видеокартой (24 ГБ VRAM) может участвовать в обучении моделей, для которых иначе потребовались бы сотни GPU в дата-центре. Распределяя вычислительный граф между сотнями или тысячами узлов, Ambient устраняет необходимость в дорогих высокоскоростных соединениях (таких как InfiniBand), используемых в традиционных ML-кластерах.
Разреженность, вдохновленная SLIDE: Большинство вычислений в нейронных сетях связано с умножением матриц, где большинство элементов близки к нулю. SLIDE (Sub-LInear Deep learning Engine) использует это, хешируя активации для определения того, какие нейроны действительно важны для данного входа, полностью пропуская нерелевантные вычисления.
Ambient применяется эту разреженность (sparsity) к распределенному обучению. Вместо того чтобы все майнеры обрабатывали все данные, сеть динамически направляет работу узлам, чьи шарды релевантны текущему пакету данных. Это снижает накладные расходы на передачу данных (основное узкое место в распределенном ML) и позволяет майнерам с более слабым оборудованием участвовать в процессе, обрабатывая разреженные подграфы.
Сочетание этих методов обеспечивает то, что, по заявлению Ambient, дает пропускную способность в 10 раз выше, чем существующие проекты распределенного обучения, такие как DiLoCo или Hivemind. Что еще важнее, это снижает порог входа: майнерам не нужна инфраструктура уровня дата-центра — обычного игрового ПК с хорошей видеокартой достаточно, чтобы внести свой вклад.
Архитектура форка Solana: высокий показатель TPS в сочетании с неблокирующим PoW
Ambient не строится с нуля. Это полный форк Solana, унаследовавший виртуальную машину Solana Virtual Machine (SVM), временные метки Proof of History (PoH) и механизм пересылки мемпула Gulf Stream. Это обеспечивает Ambient теоретическую пропускную способность Solana в 65 000 TPS и субсекундную финальность.
Однако Ambient вносит одну критическую модификацию: он добавляет неблокирующий слой proof-of-work поверх консенсуса Solana.
Вот как работает гибридный консенсус:
Proof of History упорядочивает транзакции: PoH в Solana предоставляет криптографические часы, упорядочивая транзакции без ожидания глобального консенсуса. Это позволяет реализовать параллельное выполнение на нескольких ядрах.
Proof of Logits защищает сеть: майнеры соревнуются в создании валидных результатов логического вывода ИИ (inference). Блокчейн принимает блоки от майнеров, которые генерируют наиболее ценную работу в области ИИ (определяемую сложностью вывода, размером модели или застейканной репутацией).
Неблокирующая интеграция: В отличие от Bitcoin, где создание блоков останавливается до нахождения валидного PoW, PoW в Ambient работает асинхронно. Валидаторы продолжают обрабатывать транзакции, пока м айнеры соревнуются за отправку ИИ-задач. Это предотвращает превращение PoW в узкое место.
В результате получается блокчейн, который сохраняет скорость Solana (критически важную для приложений ИИ, требующих вывода с низкой задержкой), обеспечивая при этом экономическую конкуренцию в основных видах деятельности сети — логическом выводе, тонкой настройке и обучении моделей.
Такой дизайн также позволяет избежать ранних ошибок Ethereum в консенсусе «полезной работы». Primecoin и Gridcoin пытались использовать научные вычисления в качестве PoW, но столкнулись с фатальным недостатком: полезная работа не является равномерно сложной. Некоторые задачи легко решить, но трудно проверить; другие легко несправедливо распараллелить. Ambient обходит это, делая проверку логитов вычислительно дешевой и стандартизированной. Каждая задача вывода, независимо от сложности, может быть проверена с помощью одного и того же алгоритма выборочной проверки.