AI 与数据狂飙,底层设施成最大阻力,谁来破局?

互联网 阅读 30 2025-07-10 20:50:07

为什么数据成为最有价值的资源,而谁能真正解锁它,将定义下一个十年

技术发展的历史总会出现这样的节点:创新的速度远远超过了基础设施的承载能力。我们经历过拨号上网不堪重负的 Web1 时代,也看过视频流媒体如何迅速取代传统有线电视,更亲眼见证云计算彻底颠覆软件部署和开发方式。

今天,这种基础设施滞后的现象再次发生。而这次,主角是数据

数据:价值万亿却沉睡未醒的资产

从 AI 到 IP,再到各类 Web3 应用,数据正逐渐成为推动全球经济的核心资源。它是一种资产类别,一种生产资料,也是一种新的经济组织形式。摩根士丹利预测,到 2032 年,高质量 AI 训练数据市场将超过 170 亿美元;而整体数据市场的规模已经突破 3 万亿美元

但令人讽刺的是,这种巨额价值的资源,今天大多数依然处于沉睡状态:

  • 被困在封闭平台中,无法被发现和使用;

  • 被分散在结构不同的系统中,无法组合或复用;

  • 没有有效的市场机制来进行授权、定价与流通。

这就像 20 世纪初的石油资源一样,明明遍地是金,却没有炼油厂、加油站和物流网络把它真正变成可以流通的经济价值。

AI 的瓶颈,不在算法,而在数据

今天,AI 模型对高质量结构化数据的需求越来越大。但最有价值的数据资源都掌握在少数几家科技巨头手中。全球约 95% 的训练数据由五家公司控制,而开放的数据往往是网页爬取的结果,噪声大、重复多,法律风险也越来越高。

这不仅使得 AI 模型效果受限,也让整个行业陷入“劣币驱逐良币”的困境:

  • 开源模型不得不依赖低质量的训练数据;低质量数据的问题在于其数据的准确性难以验证,而且在大多数情况下存在偏差。用低质量数据集来扩展 AI 几乎是不可能的。

  • 数据生产者得不到激励,数据稀缺进一步加剧;

  • 法律纠纷频发,AI 公司面临版权不清晰的巨大风险。 之所以会出现这些诉讼,是因为一些大型 AI 所使用的训练数据是在未经许可的情况下获取的。大多数人甚至都不知道自己的数据被用来训练 AI。这其中蕴含着巨大的价值,但却被大型科技公司提取并垄断。

链上存储方案:“补丁”太多,“系统”太少

面对这些问题,已有不少解决方案尝试弥补数据基础设施的缺陷。但多数仍然是“拼凑式”的短期应对,缺乏系统性、集成性和可持续性。例如:

  • Ethereum Blob Space(EIP-4844):只提供 18 天的临时存储,2025 年可能完全耗尽容量;

  • Celestia:实现了“数据可用性层”,但不支持结构化数据的组合与长期存储;

  • Filecoin:数据检索慢、非永久,智能合约无法直接调用其存储的数据;

  • Arweave:存储价格高度波动,性能与验证性弱,计算层 AO 依赖中心化桥接;

  • Story Protocol 等 IP 项目:专注 IP 资产的上链与管理,但缺乏与数据网络的深度集成,不支持其他应用构建;

  • Walrus:部署于其他区块链之上,成本高,功能受限,存储不永久,适配性弱。

它们分别解决了某些环节的问题,却无法提供一个结构化、原生可组合、可执行的数据基础设施

 但Irys在这里给出了不同的答案:

  • 更智能的激励机制: 通过受控分区平衡存储供给与矿工收益,保障稳定性与长期健康发展。

  • 更灵活的存储方式:同时支持短期与永久存储,按需付费更灵活。

  • 数据原生的智能合约能力:唯一支持智能合约直接读写链上数据的网络,数据与合约原生融合。

  • 快速可靠的数据访问:提供即时存取与高在线率保障。

  • 可预测的低成本定价:定价锚定硬盘成本,当前约为 $2.5/GB,永久存储预计低至 $0.03/GB。

为数据与执行协同而生的网络

Irys 正是为解决上述根本问题而设计的下一代链上数据网络。

一体化架构:从存储到执行,全部原生集成

  • 链上永久存储:数据一经上传,即可长期保留,且可以被检索、索引、复用;

  • 智能合约原生访问数据:无需依赖外部桥接或预言机,合约可以直接读写数据;

首个在区块链层面原生构建“从存储层到执行层”的低成本路径的项目。执行层既不是部署在 Irys 之上的二层(L2),也不是运行在 Irys 上的某个应用程序,而是直接内建于主网协议中的核心功能目前还没有其他网络做到这一点。

  • 为 AI 和 IP 而优化:可编程数据可以携带授权、交易、自动化指令,AI 模型可以原生调用训练集,创作者可以嵌入版权和收益分配逻辑;当然这里还有更多可能,这一切的上限只取决于开发者的创造力。

  • 生态协同:数据库协议可以结构化数据、搜索协议可以提供索引、变现协议可以支持数据许可与付费访问——所有工具都基于同一个基础网络运行,实现应用间的组合与复用。

具体例子,本质上,Irys 上的协议可以相互共享和发现数据,从而孕育出一个生态系统,在这里,数据成为推动数据创作者实现更复杂变现方式的燃料。这种机制为应用之间互相利用彼此数据创造价值提供了基础,而这些价值最终又会反哺整个主网络,形成正向循环。

举个例子:当数据真正可用时会发生什么?

  1. 一个用户上传一组数据(例如原创图像或文章);

  2. 数据库协议结构化这些数据,变成 AI 可读取的格式;

  3. 一家 AI 公司通过变现协议获取访问许可,并支付自动分成;

  4. 创作者实时收到收入,数据被多次调用,进入更大的市场;

  5. 更多开发者在此基础上构建新服务,推动生态扩展。

这个流程不依赖中心化平台,不依赖外挂系统,一切都在 Irys 原生发生。

市场正在发出信号:缺口已现,需求迫切

技术趋势往往可以从资本流向和资源瓶颈中看出端倪。今天,关于“数据”问题的紧迫性,已经通过多项市场事件体现出来:

  • Celestia 融资 1 亿美元:数据可用性成了 rollups 最大瓶颈;

  • Story Protocol 融资 1.4 亿美元:IP 上链迫在眉睫;

  • 以太坊存储成本仍然高达 $900,000/GB:不可持续;

  • AI 训练集需求急剧上升,供需失衡持续扩大

  • AI 内容侵权案件同比增长超过 200%:创作者权益保护机制缺失。

这意味着一个巨大的技术“缺口”正在打开——一个万亿级的数据基础设施空位,等待真正的解决者。

Web3 的 AWS,建立链上的数据飞轮

回顾 AWS 的成功,其关键并不在于单点技术领先,而是统一了算力、数据库与应用,创造了一个正向飞轮。

Irys 正在把这个逻辑复制到链上:

  • 用户上传的数据 → 数据库协议索引 → 授权协议变现 → 应用调用 → 反馈到更多数据生产 → 网络价值提升 → 吸引更多开发者构建

  • 每一个新协议都加强了前一个协议的作用,每一个数据调用都提升整个网络的价值。

这不仅是链上“存数据”的工具,而是一整套可扩展、可组合的数据操作系统

数据是未来最重要的资产,基础设施将决定谁赢得它

我们正站在数据基础设施重构的前夜。一方面,数据正快速成为推动 AI、内容经济、智能合约生态最关键的资产;另一方面,旧有系统已经无法支撑这一变化。

Irys 所构建的,不仅是更快或更便宜的数据存储系统,而是一个真正面向未来的基础设施网络:

  • 原生支持数据存储与调用;

  • 自动化授权与收益分配;

  • 支持 AI、IP、Web3 应用等多类数据需求;

  • 可被开发者、创作者、企业轻松接入与复用。

如果说云计算时代的 AWS 捕捉到了“计算为服务”的历史机遇,那么,Irys 正站在“数据为服务”这一巨大转变的起点上。数据经济的大门已经开启,真正的问题是——谁来建立那个支撑这一切的网络。答案正在显现。

免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代表本站的观点或立场
上一篇:日报 | 蚂蚁集团将把 Circle 的稳定币添加到其全球平台;YZi Labs 将支持 BNB 财务公司 10X Capital 并筹备 IPO 下一篇:Odaily Space回顾|证券代币化浪潮来袭:1 U买入英伟达、苹果股票,革命还是泡沫?

您可能感兴趣