斯坦福HAI《2025年人工智能指数报告》精华
作者:Stanford HAI(斯坦福人工智能研究院)
编译:Felix,PANews
斯坦福 HAI 近期发布了长达 456 页的《2025 年人工智能指数报告》。以下是人工智能趋势的一些关键要点:
1.人工智能变得比想象的要强大得多
在新的基准测试 MMMU、GPQA 和 SWE-bench 中,人工智能的表现大幅提升:得分分别提高了 18.8%、48.9% 和 67.3%。除了基准测试外,人工智能系统在生成高质量视频方面取得重大进展,在某些情况下,大型语言模型(LLM)甚至在限时的编程任务中超越了人类。
注:
MMMU 是一个精心设计的新型基准,专为大学水平的多学科多模态理解和推理而设,旨在评估基础模型在广泛任务中的专家级多模态理解能力。
GPQA 是一个具有挑战性的数据集,包含 448 道由不同领域专家编写的高质量且难度极高的多项选择题。在相应领域拥有或正在攻读博士学位的专家,准确率仅为 65%,而技能高超的非专家验证者尽管平均花费时间超过 30 分钟且可不受限制地访问网络,准确率也只有 34%。
SWE-bench 是一个用于评估大型语言模型(LLM)在从 GitHub 收集的真实世界软件问题上的表现的基准。

2.人工智能更高效、更易获取且更经济实惠
参数更少的小型人工智能模型的能力日益增强:在短短两年内,参数数量减少了约 100 倍,但其在大规模多任务语言理解(MMLU)测试中的得分仍超过 60%。
开源模型与闭源模型之间的差距也在缩小,在某些基准测试中,性能差距从 8% 降至仅 1.7%。

此外,从 2022 年 11 月到 2024 年 10 月,达到 GPT-3.5 水平的系统的推理成本下降了 280 倍以上。在硬件层面,成本每年下降 30%,而能源效率每年提高 40%。
高级人工智能的门槛正在迅速降低。更不用说像 DeepSeek 这样的稀疏模型的开发,在专家混合(MoE)的结构下,只有相关的参数会被激活以回答用户的查询,使整个事情更加高效。
的确,随着规模更小但能力更强的 AI 模型不断涌现,AI 模型训练的要求降低了,成本效益高的分布式训练有望在未来十年成为主流。目前有一些顶尖项目正在基于不同的理论框架开展相关研究。
3.人工智能正日益融入日常生活
2023 年,美国食品药品监督管理局(FDA)批准了 223 款人工智能辅助医疗设备,而 2015 年这一数字仅为 6 款。在道路上,自动驾驶汽车已不再是实验品:美国最大的运营商之一 Waymo 每周提供超过 15 万次自动驾驶服务,而百度的 Apollo Go 无人驾驶出租车车队如今已在中国多个城市投入运营。

4.企业在人工智能领域的投资大幅增加,推动创纪录的投资和应用
人工智能在商业中的应用也在加速:2024 年,78% 的组织正在使用人工智能,而前一年这一比例为 55%。与此同时,越来越多的研究证实,人工智能能够提高生产力,并有助于缩小整个劳动力队伍中的技能差距。
事实上,随着人工智能导致客户期望值呈指数级增长,现有解决方案会在一夜之间显得过时,从而使现有企业失去适应的机会,产品市场匹配崩溃的情况会更频繁地发生。
5.尽管全球对人工智能的乐观情绪上升,但亚洲人对人工智能更为乐观
在中国(83%)、印度尼西亚(80%)和泰国(77%)等国家,大多数人认为人工智能产品和服务利大于弊。相比之下,在加拿大(40%)、美国(39%)和荷兰(36%)等地,乐观情绪仍远低于此。
不过,这种态度正在转变:自 2022 年以来,一些此前持怀疑态度的国家的乐观情绪显著增长,包括德国(增长 10%)、法国(增长 10%)、加拿大(增长 8%)、英国(增长 8%)和美国(增长 4%)。

6.人工智能在科研中的影响力日益增强,已成为推动科学进步的重要驱动力
人工智能日益增长的重要性在重大科学奖项中有所体现:两项诺贝尔奖分别授予了在深度学习(物理学)和将其应用于蛋白质折叠(化学)方面做出贡献的研究,而图灵奖则表彰了在强化学习方面的开创性贡献。
显然,人工智能正以指数级、出乎意料的速度飞速发展,这对大多数人来说意义非凡。因此,人工智能安全也变得越来越重要。虽然人工智能让伪造变得更容易,但密码学则让伪造变得更加困难。期待着那些能够利用区块链的原生属性(可验证性和透明性)来构建这一领域实用解决方案的加密项目。
相关阅读:专访a16z创始人Chris Dixon:人工智能与加密技术的交汇
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代表本站的观点或立场
您可能感兴趣
-
以太坊的身份困局:是加密货币,还是比特币的影子?原文作者:AJC 原文编译:Luffy,Foresight News在所有主流加密货币资产中,以太坊引发的争论最为激烈。比特币作为主流加密货币的地位已被广泛认可,而以太坊的定位却始终悬而未决。在一部分
-
Hyperliquid 为何赚得比 Coinbase 少?原文标题:Hyperliquid at the Crossroads: Robinhood or Nasdaq Economics原文作者:@shaundadevens编译:Peggy,BlockBe
-
从 AI 到 Labubu,从黄金到加密货币:全球投机泡沫为何无处不在?
我们正处在「非理性繁荣」中吗?撰文:Brad Stone,彭博社编译:Saoirse,Foresight News在引发大萧条的「黑色星期一」股市崩盘前两个月,马萨诸塞州一位名叫罗杰・巴布森(Roge
-
火币成长学院|加密市场宏观研报:美联储降息、日本央行加息与圣诞假期叠加下的流动性再定价
当前加密市场所经历的回调,更接近于一次由全球流动性路径变化所触发的阶段性再定价,而非趋势性行情的简单反转。摘要近期加密市场的波动并非孤立行情,而是由三重宏观因素在时间维度上叠加所引发的结构性调整。首先
-
纽约时报:川普拥抱加密背后,那些没有公开的事
一系列突破行业边界的加密货币企业登陆股市,在吸引投资者入局的同时,也助推市场风险持续高企。撰文:David Yaffe-Bellany 与 Eric Lipton,纽约时报编译:Chopper,For
-
获利 58 万美金后,我再次重仓 $100 万做空 ETH
"做空 ETH 是一种简单且有效的策略。"整理 & 编译:深潮TechFlow播客源:Taiki Maeda原标题:Why I’m Shorting $1M of ETH (Again)播出日期:20
-
BitMart 推出“0滑点跟单”机制:全额补贴滑点价差,追求极致用户体验2025年12月17日 – 全球领先的数字资产交易平台 BitMart 近日正式宣布,重磅推出“0滑点跟单”保护机制。该功能旨在彻底解决困扰跟单用户的“滑点损耗”痛点,通过平台全额补贴价差的方式,确保
-
比特币矿工为何集体转向AI?背后原因惊人本文由Tiger Research撰写,探讨了比特币的价格暴跌迫使矿工转变其商业模式。 要点总结收入不稳定和比特币挖矿成本不断上涨使得加密矿企核心业务不稳定。因此,加密矿企转型,利用现有矿场将数据中心
泰达币
比特币
以太坊
OFFICIAL TRUMP
USD Coin
Solana
First Digital USD
瑞波币
币安币
大零币
狗狗币
莱特币
Sui
波场
Avalanche
FIL
OKB
LUNC
SHIB
ZEN
ETC
CAKE
DOT
YGG