跳到主要内容

223 篇博文 含有标签「AI」

人工智能和机器学习应用

查看所有标签

Gensyn 的 Judge 解决了 AI 最大的信任缺口:谁来评估评估者?

· 阅读需 11 分钟
Dora Noda
Software Engineer

GPT-4 在被要求对同一响应进行两次评判时,有 40% 的概率会自相矛盾。Bard 在医疗系统评价中的参考文献幻觉率高达 91%。而那些旨在保持 AI 诚实的基准测试呢?模型正越来越多地针对这些基准进行优化以博取高分。整个 AI 评估技术栈——即告诉我们模型是否优秀、安全或真实的基础设施——正建立在不透明、不可重现且在我们脚下悄然变动的根基之上。

由 a16z crypto、CoinFund 和 Protocol Labs 支持,获得 5,000 万美元融资的去中心化机器学习协议 Gensyn 认为,它找到了一个结构性的解决方案。其名为 Judge 的新系统将加密可验证的 AI 评估引入生产环境——用确定性的、可挑战的链上模型质量证明取代了黑盒 API 调用。如果该系统能够大规模运行,它可能会重塑 AI 行业建立信任的方式。

你的 AI Agent 刚刚触犯了联邦法律 —— 揭秘可能扼杀智能体商业的裁决

· 阅读需 11 分钟
Dora Noda
Software Engineer

旧金山的一位联邦法官最近裁定,你的 AI 购物助手可能违反了用于起诉黑客的法律 —— 即使你明确要求它代表你行事。2026 年 3 月的亚马逊诉 Perplexity 案裁决划定了一条可能重塑整个 AI 代理行业的界限:用户许可不等于平台许可

这一裁决的影响远超某家公司的浏览器。随着 17,000 多个自主代理在 Web2 和 Web3 中每天执行数百万次交易,这一裁决迫使人们思考一个根本性问题:到底是谁授权 AI 代理采取行动 —— 是部署它的人,还是它触达的平台?

你的 AI 智能体刚刚成了罪犯:亚马逊对 Perplexity 的裁决如何重写自主软件的规则

· 阅读需 11 分钟
Dora Noda
Software Engineer

旧金山的一位联邦法官刚刚划定了一条界线,每位构建 AI 代理的开发者都必须理解这一点。2026 年 3 月 9 日,Maxine M. Chesney 法官裁定,Perplexity 的 Comet 浏览器通过代表用户访问亚马逊账户,违反了联邦《计算机欺诈与滥用法案》(CFAA)和加利福尼亚州《综合计算机数据访问与欺诈法案》—— 尽管这些用户明确授予了许可。关键的区别在于:用户授权并不等同于平台授权。

这一裁决不仅影响 Perplexity。它可能会使数百家初创公司、加密协议和 Web3 项目目前正在构建的一整类 AI 代理行为被定性为犯罪。

稳定币可见性差距:AI 代理正基于两周前的 PDF 文件做出万亿美元级的决策

· 阅读需 8 分钟
Dora Noda
Software Engineer

一个管理着 5000 万美元 DeFi 金库的 AI 代理需要跨三个稳定币池进行再平衡。它查询每个代币的最新储备数据。它能找到的最新的报告是什么?一份 14 天前发布的 PDF 证明,其基础是 3 天前捕获的快照。在快照拍摄以来的 17 天里,发行方可能已经在储备资产之间转移了数十亿美元——而该代理永远不会知道。

欢迎来到稳定币可见性差距:即 AI 代理做出财务决策的速度与稳定币储备验证和披露的缓慢速度之间日益扩大的鸿沟。

稳定币可见性缺口:AI 智能体正基于过时的 PDF 报告做出万亿美元级别的决策

· 阅读需 10 分钟
Dora Noda
Software Engineer

一个管理着 5000 万美元财政分配的 AI 智能体正在检查某主要稳定币的储备构成。目前能获得的最新数据?十四天前发布的一份 PDF。自该报告生成以来,发行方可能已经在资产类别之间转移了数十亿资金,面临过赎回潮,或悄悄更换了托管人。智能体并不知道——也无法询问。

这就是稳定币可见性缺口,它可能是当今数字金融中被低估程度最高的系统性风险。

Tempo 的机器支付协议:Stripe 和 Paradigm 如何构建金融领域的 OAuth —— 以及为什么它对每个 AI 智能体都至关重要

· 阅读需 12 分钟
Dora Noda
Software Engineer

几十年来,互联网一直有一个休眠的状态码:HTTP 402 —— “需要付款”(Payment Required)。它曾被保留以备将来使用,是为从未面世的 Web 原生支付层预留的占位符。2026 年 3 月 18 日,Stripe 和 Paradigm 终于激活了它。

他们专注于支付的 Layer 1 区块链 Tempo 与机器支付协议(MPP)一同上线主网。MPP 是一项开放标准,允许 AI Agent 在无需人工干预的情况下请求、授权和结算支付。在上线的第一周内,MPP 已经集成了包括 OpenAI、Anthropic、Google Gemini 和 Dune Analytics 在内的 50 多个服务。Visa 将其扩展到了卡片支付,Lightspark 将其扩展到了比特币闪电网络(Bitcoin Lightning)。

这不仅仅是又一个区块链的发布。这是机器对机器(M2M)商业获得其支付轨道(payment rails)的时刻。

应用时代的终结:AI 代理如何成为 Web3 的主要软件接口

· 阅读需 9 分钟
Dora Noda
Software Engineer

如果下十亿名区块链用户从不下载钱包、从不批准交易,也从不查看区块浏览器,会怎样?那个未来已不再是假设 —— 它正被当下构建。

2026 年第一季度,每日活跃的链上 AI Agent(智能体)突破了 250,000 个,同比增长超过 400%。本季度推出的新 DeFi 协议中,超过 68% 都附带了至少一个用于交易或流动性管理的自主 AI Agent。与此同时,Gartner 预测,到 2026 年底,40% 的企业级应用将嵌入特定任务的 AI Agent —— 而 2025 年这一比例还不足 5%。我们所熟知的应用(App)正在被掏空,Agent 正在取而代之。

x402 + A2A + MCP: 驱动自主代理经济的三层协议栈

· 阅读需 12 分钟
Dora Noda
Software Engineer

2026 年 3 月,桑坦德银行(Banco Santander)和万事达卡(Mastercard)完成了欧洲首个完全由 AI 代理执行的端到端实时支付——没有人类点击“确认”,没有浏览器加载结账页面,也没有输入卡号。该交易在链上不到两秒便完成了结算。这不是一次演示,而是在生产级基础设施上运行的商业支付,它依赖于三个在幕后协同工作的、大多数人从未听说过的开放协议。

这三个协议——Coinbase 的 x402、Google 的 Agent2Agent (A2A) 以及 Anthropic 的模型上下文协议(Model Context Protocol,简称 MCP)——正悄然汇聚成一个统一的技术栈,定义了自主代理如何发现服务、相互协调以及为所使用的服务付费。它们共同构成了代理经济的 TCP/IP 时刻:这是让机器对机器(M2M)商务不仅成为可能、而且成为必然的基础设施。

电网正在拥有“大脑”:DePIN 与 AI 如何构建能源互联网

· 阅读需 10 分钟
Dora Noda
Software Engineer

想象一下,如果你的家庭电池可以与邻居的太阳能电池板协商电价——自主地在毫秒内完成,并在链上结算?这种情况不再只是理论。在 2026 年,去中心化物理基础设施网络(DePIN)正在与 AI 驱动的电网协调相结合,创造出能源行业几十年来一直谈论但从未实现的成果:一个真正的分布式、智能电网。

世界经济论坛预测,到 2028 年,DePIN 将增长为一个价值 3.5 万亿美元的行业,而能源正成为其最具体的应用案例。随着 AI 数据中心预计到 2030 年将消耗美国 9% 的电力,且全球能源需求激增,中心化的公用事业模型在它从未被设计用来应对的压力下正处于崩溃边缘。