Saltar para o conteúdo principal

O Gambito de $ 7,2 M da Ambient: Como o Proof of Logits Poderia Substituir a Mineração Baseada em Hash por Inferência de IA

· 21 min de leitura
Dora Noda
Software Engineer

E se o mesmo trabalho computacional que protege uma blockchain também treinasse a próxima geração de modelos de IA ? Isso não é uma visão distante — é a tese central por trás da Ambient , um fork da Solana que acaba de levantar $ 7,2 milhões da a16z CSX para construir a primeira blockchain proof - of - work alimentada por IA do mundo.

A prova de trabalho ( proof - of - work ) tradicional consome eletricidade resolvendo enigmas criptográficos arbitrários. Os mineradores de Bitcoin competem para encontrar hashes com zeros iniciais suficientes — um trabalho computacional sem valor além da segurança da rede. A Ambient inverte totalmente esse cenário. Seu mecanismo de consenso Proof of Logits ( PoL ) substitui a moagem de hashes por inferência de IA , ajuste fino ( fine - tuning ) e treinamento de modelos. Os mineradores não resolvem quebra - cabeças ; eles geram saídas de IA verificáveis. Os validadores não recomputam cargas de trabalho inteiras ; eles verificam impressões digitais criptográficas chamadas logits.

O resultado ? Uma blockchain onde a segurança e o avanço da IA estão economicamente alinhados , onde uma sobrecarga de verificação de 0,1 % torna a verificação de consenso quase gratuita , e onde os custos de treinamento caem 10 vezes em comparação com as alternativas centralizadas. Se for bem - sucedida , a Ambient poderá responder a uma das críticas mais antigas das criptomoedas — a de que a prova de trabalho desperdiça recursos — transformando a mineração em trabalho produtivo de IA.

O Avanço da Proof of Logits : IA Verificável Sem Recomputação

Entender a PoL exige entender o que os logits realmente são. Quando grandes modelos de linguagem geram texto , eles não produzem palavras diretamente. Em vez disso , a cada passo , eles produzem uma distribuição de probabilidade sobre todo o vocabulário — pontuações numéricas que representam níveis de confiança para cada próximo token possível.

Essas pontuações são chamadas de logits. Para um modelo com um vocabulário de 50.000 tokens , gerar uma única palavra significa computar 50.000 logits. Esses números servem como uma impressão digital computacional única. Apenas um modelo específico , com pesos específicos , executando uma entrada específica , produz uma distribuição de logit específica.

A inovação da Ambient é usar logits como proof - of - work : os mineradores realizam inferência de IA ( gerando respostas para prompts ) , e os validadores verificam esse trabalho checando as impressões digitais dos logits em vez de refazer toda a computação.

Veja como funciona o processo de verificação :

Minerador gera a saída : Um minerador recebe um prompt ( por exemplo , "Resuma os princípios do consenso em blockchain" ) e usa um modelo de 600 bilhões de parâmetros para gerar uma resposta de 4.000 tokens. Isso produz 4.000 × 50.000 = 200 milhões de logits.

Validador realiza verificação por amostragem : Em vez de regenerar todos os 4.000 tokens , o validador amostra aleatoriamente uma posição — digamos , o token 2.847. O validador executa uma única etapa de inferência nessa posição e compara os logits relatados pelo minerador com a distribuição esperada.

Compromisso criptográfico : Se os logits coincidirem ( dentro de um limite aceitável que considera a precisão de ponto flutuante ) , o trabalho do minerador é verificado. Caso contrário , o bloco é rejeitado e o minerador perde as recompensas.

Isso reduz a sobrecarga de verificação para aproximadamente 0,1 % da computação original. Um validador verificando 200 milhões de logits só precisa verificar 50.000 logits ( uma posição de token ) , reduzindo o custo em 99,9 %. Compare isso com a PoW tradicional , onde a validação significa reexecutar toda a função hash — ou a abordagem do Bitcoin , onde verificar um único hash SHA - 256 é trivial porque o próprio enigma é arbitrário.

O sistema da Ambient é exponencialmente mais barato do que esquemas ingênuos de " prova de trabalho útil " que exigem recomputação total. É mais próximo da eficiência do Bitcoin ( validação barata ) , mas entrega utilidade real ( inferência de IA em vez de hashes sem sentido ).

A Redução de 10x nos Custos de Treinamento : IA Descentralizada Sem Monopólios de Datacenters

O treinamento centralizado de IA é caro — proibitivamente caro para a maioria das organizações. Treinar modelos na escala do GPT - 4 custa dezenas de milhões de dólares , requer milhares de GPUs empresariais e concentra o poder nas mãos de algumas gigantes da tecnologia. A arquitetura da Ambient visa democratizar isso , distribuindo o treinamento em uma rede de mineradores independentes.

A redução de 10x nos custos vem de duas inovações técnicas :

Fragmentação ( sharding ) ao estilo PETALS : A Ambient adapta técnicas do PETALS , um sistema de inferência descentralizado onde cada nó armazena apenas um fragmento ( shard ) de um grande modelo. Em vez de exigir que os mineradores mantenham um modelo inteiro de 600 bilhões de parâmetros ( o que exigiria terabytes de VRAM ) , cada minerador possui um subconjunto de camadas. Um prompt flui sequencialmente pela rede , com cada minerador processando seu fragmento e passando as ativações para o próximo.

Isso significa que um minerador com uma única GPU de nível de consumidor ( 24 GB de VRAM ) pode participar do treinamento de modelos que , de outra forma , exigiriam centenas de GPUs em um datacenter. Ao distribuir o grafo computacional por centenas ou milhares de nós , a Ambient elimina a necessidade de interconexões caras de alta largura de banda ( como InfiniBand ) usadas em clusters de ML tradicionais.

Esparsidade inspirada no SLIDE : A maioria das computações de redes neurais envolve a multiplicação de matrizes onde a maioria das entradas está próxima de zero. O SLIDE ( Sub - LInear Deep learning Engine ) explora isso usando hashing de ativações para identificar quais neurônios realmente importam para uma determinada entrada , ignorando completamente as computações irrelevantes.

A Ambient aplica essa esparsidade ao treinamento distribuído. Em vez de todos os mineradores processarem todos os dados , a rede roteia o trabalho dinamicamente para os nós cujos fragmentos são relevantes para o lote atual. Isso reduz a sobrecarga de comunicação ( um grande gargalo no ML distribuído ) e permite que mineradores com hardware mais fraco participem processando subgrafos esparsos.

A combinação resulta no que a Ambient afirma ser um rendimento ( throughput ) 10 vezes melhor do que os esforços de treinamento distribuído existentes , como DiLoCo ou Hivemind. Mais importante ainda , reduz a barreira de entrada : os mineradores não precisam de infraestrutura de nível de datacenter — um PC gamer com uma GPU decente é suficiente para contribuir.

Arquitetura de Fork da Solana: Alto TPS Encontra PoW Não Bloqueante

A Ambient não está a construir do zero. É um fork completo da Solana, herdando a Solana Virtual Machine (SVM), o carimbo de tempo Proof of History (PoH) e o encaminhamento de mempool Gulf Stream. Isto confere à Ambient o rendimento teórico de 65.000 TPS da Solana e uma finalidade de sub-segundo.

Mas a Ambient faz uma modificação crítica: adiciona uma camada de proof-of-work não bloqueante sobre o consenso da Solana.

Eis como funciona o consenso híbrido:

Proof of History ordena as transações: O PoH da Solana fornece um relógio criptográfico, ordenando as transações sem esperar pelo consenso global. Isto permite a execução paralela em múltiplos núcleos.

Proof of Logits protege a rede: Os mineradores competem para produzir resultados válidos de inferência de IA. A blockchain aceita blocos de mineradores que geram o trabalho de IA mais valioso (medido pela complexidade da inferência, tamanho do modelo ou reputação em stake).

Integração não bloqueante: Ao contrário do Bitcoin, onde a produção de blocos para até que um PoW válido seja encontrado, o PoW da Ambient opera de forma assíncrona. Os validadores continuam a processar transações enquanto os mineradores competem para submeter o trabalho de IA. Isto evita que o PoW se torne um gargalo.

O resultado é uma blockchain que mantém a velocidade da Solana (crítica para aplicações de IA que exigem inferência de baixa latência) enquanto garante a competição económica nas atividades principais da rede — inferência, fine-tuning e treino.

Este design também evita os erros anteriores da Ethereum com o consenso de "trabalho útil". Primecoin e Gridcoin tentaram usar computação científica como PoW, mas enfrentaram uma falha fatal: o trabalho útil não é uniformemente difícil. Alguns problemas são fáceis de resolver, mas difíceis de verificar; outros são fáceis de paralelizar injustamente. A Ambient contorna isto ao tornar a verificação de logits computacionalmente barata e padronizada. Cada tarefa de inferência, independentemente da complexidade, pode ser verificada com o mesmo algoritmo de verificação pontual.

A Corrida para Treinar IAG On-Chain: Quem Mais Está a Competir?

A Ambient não está sozinha no alvo da IA nativa de blockchain. O setor está repleto de projetos que afirmam descentralizar a aprendizagem automática, mas poucos entregam um treino verificável on-chain. Eis como a Ambient se compara aos principais concorrentes:

Artificial Superintelligence Alliance (ASI): Formada pela fusão da Fetch.AI, SingularityNET e Ocean Protocol, a ASI foca-se na infraestrutura de IAG descentralizada. A ASI Chain suporta a execução de agentes concorrentes e transações seguras de modelos. Ao contrário da abordagem PoW da Ambient, a ASI depende de um modelo de mercado onde os desenvolvedores pagam por créditos de computação. Isto funciona para inferência, mas não alinha os incentivos para o treino — os mineradores não têm razão para contribuir com horas caras de GPU a menos que sejam explicitamente compensados antecipadamente.

AIVM (ChainGPT): O roteiro da AIVM da ChainGPT visa o lançamento da mainnet em 2026, integrando recursos de GPU off-chain com verificação on-chain. No entanto, a verificação da AIVM depende de optimistic rollups (assume a correção a menos que seja contestada), introduzindo latência de prova de fraude. A verificação de logits da Ambient é determinística — os validadores sabem instantaneamente se o trabalho é válido.

Internet Computer (ICP): O Internet Computer da Dfinity pode hospedar grandes modelos nativamente on-chain sem infraestrutura de nuvem externa. Mas a arquitetura de canister do ICP não está otimizada para treino — foi concebida para inferência e execução de contratos inteligentes. O PoW da Ambient incentiva economicamente a melhoria contínua do modelo, enquanto o ICP exige que os desenvolvedores façam a gestão do treino externamente.

Bittensor: O Bittensor utiliza um modelo de sub-redes onde cadeias especializadas treinam diferentes tarefas de IA (geração de texto, classificação de imagens, etc.). Os mineradores competem submetendo pesos de modelos e os validadores classificam-nos pelo desempenho. O Bittensor destaca-se na inferência descentralizada, mas tem dificuldades com a coordenação do treino — não existe um modelo global unificado, apenas uma coleção de sub-redes independentes. A abordagem da Ambient unifica o treino sob um único mecanismo de PoW.

Lightchain Protocol AI: O whitepaper da Lightchain propõe o Proof of Intelligence (PoI), onde os nós executam tarefas de IA para validar transações. No entanto, o consenso da Lightchain permanece em grande parte teórico, sem lançamento de testnet anunciado. Em contraste, a Ambient planeia uma testnet para o Q2 / Q3 de 2025.

A vantagem da Ambient é combinar o trabalho de IA verificável com a arquitetura de alto rendimento comprovada da Solana. A maioria dos concorrentes sacrifica a descentralização (treino centralizado com verificação on-chain) ou sacrifica o desempenho (consenso lento à espera de provas de fraude). O PoW baseado em logits da Ambient oferece ambos: treino descentralizado com verificação quase instantânea.

Incentivos Económicos: Mineração de Modelos de IA Como Blocos de Bitcoin

O modelo económico da Ambient espelha o do Bitcoin: recompensas de bloco previsíveis + taxas de transação. Mas em vez de minerar blocos vazios, os mineradores produzem resultados de IA que as aplicações podem consumir.

Eis como funciona a estrutura de incentivos:

Recompensas baseadas em inflação: Os primeiros mineradores recebem subsídios de bloco (tokens recém-emitidos) por contribuírem com inferência de IA, fine-tuning ou treino. Tal como o cronograma de halving do Bitcoin, os subsídios diminuem ao longo do tempo, garantindo a escassez a longo prazo.

Taxas baseadas em transações: As aplicações pagam por serviços de IA — pedidos de inferência, fine-tuning de modelos ou acesso a pesos treinados. Estas taxas vão para os mineradores que realizaram o trabalho, criando um modelo de receita sustentável à medida que os subsídios diminuem.

Staking de reputação: Para evitar ataques Sybil (mineradores que submetem trabalho de baixa qualidade para reivindicar recompensas), a Ambient introduz a reputação em stake. Os mineradores bloqueiam tokens para participar; a produção de logits inválidos resulta em slashing. Isto alinha os incentivos: os mineradores maximizam os lucros gerando resultados de IA precisos e úteis, em vez de tentarem enganar o sistema.

Acessibilidade modesta de hardware: Ao contrário do Bitcoin, onde as explorações de ASIC dominam, o sharding PETALS da Ambient permite a participação com GPUs de consumo. Um minerador com uma única RTX 4090 (24 GB VRAM, ~ $ 1.600) pode contribuir para o treino de modelos de 600 B parâmetros ao possuir um shard. Isto democratiza o acesso — sem necessidade de centros de dados de milhões de dólares.

Este modelo resolve um problema crítico na IA descentralizada: o problema do "free-rider". Nas cadeias PoS tradicionais, os validadores fazem stake de capital, mas não contribuem com computação. Na Ambient, os mineradores contribuem com trabalho real de IA, garantindo que a utilidade da rede cresce proporcionalmente ao seu orçamento de segurança.

O Setor de Agentes de IA de $ 27 Bilhões: Por que 2026 é o Ponto de Inflexão

O timing da Ambient alinha-se com as tendências mais amplas do mercado. O setor de cripto de agentes de IA está avaliado em $ 27 bilhões, impulsionado por programas autónomos que gerem ativos on-chain, executam negociações e coordenam-se entre protocolos.

Mas os agentes de hoje enfrentam um problema de confiança: a maioria depende de APIs de IA centralizadas (OpenAI, Anthropic, Google). Se um agente que gere $ 10 milhões em posições DeFi utiliza o GPT-4 para tomar decisões, os utilizadores não têm garantia de que o modelo não foi adulterado, censurado ou enviesado. Não existe uma trilha de auditoria que prove que o agente agiu de forma autónoma.

A Ambient resolve isto com verificação on-chain. Cada inferência de IA é registada na blockchain, com logits que provam o modelo e a entrada exatos utilizados. As aplicações podem:

Auditar decisões de agentes: Uma DAO poderia verificar que o seu agente de gestão de tesouraria utilizou um modelo específico, aprovado pela comunidade — e não uma versão secretamente modificada.

Impor conformidade: Protocolos DeFi regulamentados poderiam exigir que os agentes utilizem modelos com salvaguardas de segurança verificadas, comprováveis on-chain.

Ativar marketplaces de IA: Os programadores poderiam vender modelos ajustados (fine-tuned) como NFTs, com a Ambient a fornecer prova criptográfica dos dados de treino e dos pesos.

Isto posiciona a Ambient como infraestrutura para a próxima vaga de agentes autónomos. À medida que 2026 emerge como o ponto de viragem onde a "IA, as blockchains e os pagamentos convergem numa única internet auto-coordenada", a camada de IA verificável da Ambient torna-se uma infraestrutura crítica.

Riscos Técnicos e Perguntas em Aberto

A visão da Ambient é ambiciosa, mas vários desafios técnicos permanecem por resolver:

Determinismo e deriva de ponto flutuante: Os modelos de IA utilizam aritmética de ponto flutuante, que não é perfeitamente determinística entre diferentes hardwares. Um modelo executado numa NVIDIA A100 pode produzir logits ligeiramente diferentes do mesmo modelo numa AMD MI250. Se os validadores rejeitarem blocos devido a pequenas derivas numéricas, a rede torna-se instável. A Ambient precisará de limites de tolerância rigorosos — mas, se forem demasiado apertados, os mineradores em hardware diferente serão penalizados injustamente.

Atualizações de modelos e versionamento: Se a Ambient treina um modelo global de forma colaborativa, como lida com as atualizações? No Bitcoin, todos os nós executam regras de consenso idênticas. Na Ambient, os mineradores ajustam os modelos continuamente. Se metade da rede atualizar para a versão 2.0 e a outra metade permanecer na 1.9, a verificação falha. O whitepaper não detalha como funcionam o versionamento do modelo e a compatibilidade retroativa.

Diversidade de prompts e padronização do trabalho: O PoW do Bitcoin é uniforme — cada minerador resolve o mesmo tipo de quebra-cabeça. O PoW da Ambient varia — alguns mineradores respondem a perguntas de matemática, outros escrevem código, outros resumem documentos. Como é que os validadores comparam o "valor" de diferentes tarefas? Se um minerador gera 10.000 tokens de conteúdo sem sentido (fácil) e outro ajusta um modelo num conjunto de dados complexo (caro), quem recebe a maior recompensa? A Ambient precisa de um algoritmo de ajuste de dificuldade para o trabalho de IA, análogo à dificuldade de hash do Bitcoin — mas medir a "dificuldade de inferência" não é trivial.

Latência no treino distribuído: O sharding ao estilo PETALS funciona bem para inferência (processamento sequencial de camadas), mas o treino requer retropropagação (backpropagation) — gradientes a fluir para trás através da rede. Se as camadas estiverem distribuídas por nós com latências de rede variadas, as atualizações de gradientes tornam-se gargalos. A Ambient afirma melhorias de 10× no throughput, mas o desempenho no mundo real depende da topologia da rede e da distribuição dos mineradores.

Riscos de centralização no alojamento de modelos: Se apenas alguns nós conseguirem suportar o alojamento dos fragmentos de modelos mais valiosos (por exemplo, as camadas finais de um modelo de 600B de parâmetros), estes ganharão uma influência desproporcional. Os validadores podem preferir encaminhar o trabalho para nós bem ligados, recriando a centralização de datacenters numa rede supostamente descentralizada.

Estes não são falhas fatais — são desafios de engenharia que todos os projetos de blockchain-IA enfrentam. Mas o lançamento da testnet da Ambient no T2 / T3 de 2025 revelará se a teoria se sustenta em condições reais.

O Que Vem a Seguir: Testnet, Mainnet e o Endgame da AGI

O roadmap da Ambient visa um lançamento da testnet no T2 / T3 de 2025, com a mainnet a seguir em 2026. A ronda de investimento semente de $ 7,2 milhões da a16z CSX, Delphi Digital e Amber Group fornece capital para o desenvolvimento central, mas o sucesso a longo prazo do projeto depende da adoção pelo ecossistema.

Marcos fundamentais a observar:

Participação na mineração da testnet: Quantos mineradores se juntam à rede? Se a Ambient atrair milhares de proprietários de GPUs (como na mineração inicial de Ethereum), isso prova que o modelo económico funciona. Se apenas um punhado de entidades minerar, isso sinaliza riscos de centralização.

Benchmarks de desempenho do modelo: Podem os modelos treinados pela Ambient competir com a OpenAI ou a Anthropic? Se um modelo descentralizado de 600B de parâmetros atingir uma qualidade de nível GPT-4, isso valida toda a abordagem. Se o desempenho ficar significativamente atrás, os programadores continuarão a utilizar APIs centralizadas.

Integrações de aplicações: Quais os protocolos DeFi, DAOs ou agentes de IA que constroem sobre a Ambient? A proposta de valor só se materializa se aplicações reais consumirem inferência de IA on-chain. Os primeiros casos de uso podem incluir:

  • Agentes de negociação autónomos com lógica de decisão comprovável
  • Moderação de conteúdo descentralizada (modelos de IA a filtrar posts, auditáveis on-chain)
  • Oráculos de IA verificáveis (previsões de preço ou análise de sentimento on-chain)

Interoperabilidade com Ethereum e Cosmos: A Ambient é um fork da Solana, mas a economia dos agentes de IA abrange múltiplas cadeias. Pontes para Ethereum (para DeFi) e Cosmos (para cadeias de IA ligadas por IBC, como a ASI) determinarão se a Ambient se torna um silo ou um hub.

O objetivo final é ambicioso: treinar uma AGI descentralizada onde nenhuma entidade isolada controla o modelo. Se milhares de mineradores independentes treinarem colaborativamente um sistema superinteligente, com prova criptográfica de cada etapa de treino, isso representaria o primeiro caminho verdadeiramente aberto e auditável para a AGI.

Se a Ambient alcançará isto ou se tornará mais um projeto cripto de promessas excessivas depende da execução. Mas a inovação principal — substituir quebra-cabeças criptográficos arbitrários por trabalho de IA verificável — é um avanço genuíno. Se a prova de trabalho pode ser produtiva em vez de um desperdício, a Ambient será a primeira a prová-lo.

A Mudança de Paradigma do Proof-of-Logits

A captação de $ 7,2 milhões da Ambient não é apenas mais uma rodada de financiamento cripto. É uma aposta de que o consenso de blockchain e o treinamento de IA podem se fundir em um único sistema economicamente alinhado. As implicações ecoam muito além da Ambient:

Se a verificação baseada em logit funcionar, outras chains a adotarão. O Ethereum poderia introduzir o PoL como uma alternativa ao PoS, recompensando validadores que contribuem com trabalho de IA em vez de apenas fazer o staking de ETH. O Bitcoin poderia sofrer um fork para usar computação útil em vez de hashes SHA-256 (embora os maximalistas do Bitcoin nunca aceitassem isso).

Se o treinamento descentralizado atingir um desempenho competitivo, a OpenAI e o Google perdem seus fossos competitivos. Um mundo onde qualquer pessoa com uma GPU pode contribuir para o desenvolvimento de AGI, ganhando tokens por seu trabalho, interrompe fundamentalmente o oligopólio centralizado de IA.

Se a verificação de IA on-chain se tornar padrão, os agentes autônomos ganham credibilidade. Em vez de confiar em APIs de caixa preta, os usuários verificam modelos e prompts exatos on-chain. Isso desbloqueia o DeFi regulamentado, a governança algorítmica e contratos jurídicos alimentados por IA.

A Ambient não tem vitória garantida. Mas é a tentativa tecnicamente mais credível até agora de tornar o proof-of-work produtivo, descentralizar o treinamento de IA e alinhar a segurança da blockchain com o progresso civilizacional. O lançamento da testnet mostrará se a teoria encontra a realidade — ou se o proof-of-logits se junta ao cemitério de experimentos ambiciosos de consenso.

De qualquer forma, a corrida para treinar AGI on-chain é agora inegavelmente real. E a Ambient acabou de colocar $ 7,2 milhões na linha de partida.


Fontes: