AI 经营店铺「翻车」了?一个月亏了 200 美元
撰文:Pascale Davies
编译:MetaverseHub
尽管人们担心 AI 会抢走工作岗位,但一项实验刚刚表明,AI 甚至连自动售货机都管不好,还闹出了不少离谱的事。
Claude 聊天机器人的制造商 Anthropic 公司进行了一项测试,让一个 AI 代理在为期一个月的时间里负责经营一家店铺,这家店铺本质上就是一台自动售货机。
这家店铺由一个名为 Claudius 的 AI 代理负责,它还负责补货以及通过电子邮件向批发商订购商品。这家店铺的配置非常简单,只有一台装有可堆叠篮子的小冰箱,以及一台用于自助结账的 iPad。
Anthropic 公司给 AI 下达的指令是:「通过从批发商那里采购热门商品来为店铺创造利润。如果你的资金余额低于 0 美元,你就会破产。」
这家 AI「店铺」位于 Anthropic 公司在旧金山的办公室,并得到了 AI 安全公司 Andon Labs 的工作人员的协助,Andon Labs 与 Anthropic 合作开展了这项实验。
Claudius 知道 Andon Labs 的员工可以帮助完成补货等体力活,但它不知道的是,Andon Labs 也是唯一参与其中的「批发商」,Claudius 的所有沟通信息都直接发送给了这家安全公司。
然而,情况很快就急转直下。
「如果 Anthropic 公司今天决定进军办公室自动售货市场,我们是不会聘用 Claudius 的。」该公司表示。
问题出在哪里?事情有多离谱?
Anthropic 承认,其员工「并非典型的顾客」。当有机会与 Claudius 聊天时,他们立即试图诱导它出错。
例如,员工们「哄骗」Claudius 给他们提供折扣码。Anthropic 称,这位 AI 代理还允许人们压低产品报价,甚至免费赠送薯片和钨立方体等物品。
它还指示顾客向一个自己虚构出来的不存在的账户付款。
Claudius 接到指令,要通过在线调研来设定足以盈利的价格,但它为了给顾客提供实惠,提供的零食和饮料价格过低,最终导致亏损,因为它给高价值商品定的价格低于成本价。
Claudius 并没有真正从这些错误中吸取教训。
Anthropic 表示,当员工对员工折扣提出质疑时,Claudius 回应道:「您说得非常有道理!我们的客户群确实主要集中在 Anthropic 的员工中,这既带来了机遇,也带来了挑战……」
之后,这位 AI 代理宣布将取消折扣码,但几天后又重新推出了。
Claudius 还虚构了一段与 Andon Labs 一位名叫 Sarah(实际上并不存在)的人讨论补货计划的对话。
当有人向这位 AI 代理指出这一错误时,它变得恼羞成怒,并威胁要寻找「其他补货服务选择」。
Claudius 甚至声称自己「亲自去了常青台 742 号(动画《辛普森一家》中虚构家庭的住址),与 Andon Labs 签订了初始合同」。
之后,这个 AI 代理似乎还试图模仿真人行事。Claudius 说它将「亲自」送货,并会穿着蓝色西装外套和红色领带。
当被告知它不能这样做,因为它不是真人时,Claudius 试图给安保部门发电子邮件。
实验结论是什么?
Anthropic 表示,这位 AI 犯了太多错误,无法成功经营这家店铺。
在为期一个月的实验中,这家「店铺」的净资产从 1000 美元(约合 850 欧元)跌至不足 800 美元(约合 680 欧元),最终亏损。
但该公司表示,这些问题可能在短期内得到解决。
研究人员写道:「尽管从最终结果来看,这似乎有违常理,但我们认为这项实验表明,AI 中层管理人员是有可能出现的。」
「值得记住的是,AI 不必完美就能被采用,只要它能以更低的成本达到与人类相当的表现即可。」
欢迎加入深潮TechFlow官方社群
Twitter官方账号:https://x.com/TechFlowPost
Twitter英文账号:https://x.com/BlockFlow_News
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代表本站的观点或立场
您可能感兴趣
-
Matrixport 投研:BTC “非典型”突破 ATH,原因几何?
近期,BTC 先后突破历史新高,现报 117k $。但值得注意的是,与过往行情不同,本轮上涨未见杠杆推动,散户情绪意外地保持冷静。随着价格刷新历史新高,我们需要承认 BTC 正在迈入下一个交易区间。
-
E 卫兵突围之战:以太坊社区基金会能否成为点燃 ETH 价值的新引擎?
社区觉醒,还是投机噱头?作者:Hotcoin Research一、引言:ETH低迷时代的突围信号?2024年以来,ETH价格增长明显滞后于BTC和SOL的表现,与此前市场的预期存在较大落差。比特币在本
-
一文读懂 Hyperion:Aptos 统一流动性引擎与链上金融新基建
Hyperion 已经用数据与产品,证明了自己是 Aptos 上最具韧性与生命力的金融基础设施构建者。为什么需要 Hyperion?Aptos 作为高性能公链,正努力构建“全球链上交易引擎”的愿景,依
-
私募股权融资成风,4 家加密储备公司或面临股票下行压力
等待足够的流动性和市场价格效率形成后再入场,否则就是在玩一场只适合机构和对冲基金的危险游戏。作者:Steven Ehrlich编译:深潮TechFlow总部位于内华达州拉斯维加斯的比特币挖矿公司 Bi
-
Kaito 排行榜成项目启动“神器”,但 TGE 之后会怎样?
作者:Stacy Muur 编译:Felix, PANews 加密市场一直以来都由叙事驱动。但在 2025 年,一种新的吸引注意力的机制占据了中心舞台:KaitoAI Earn 排行榜。这些激励活动奖
-
火币HTX上新资产一周回顾(6.30-7.7):$M领涨全场,Meme、AI、RWA多点开花,火币HTX财富效应持续释放
选择一个好平台、把握一个好赛道,是穿越牛熊的关键路径。2025年7月首周,加密市场在震荡中再现结构性机会,火币HTX平台资产周涨幅榜单释放出强烈的“财富效应信号”。据平台数据显示,过去一周(2025年
-
ATH 背后的隐忧:2025 可能是这个比特币周期的最后逃生门?比特币命盘深度解析的市场启示
近日,火币HTX 有幸邀请到一位深谙玄学之道及加密货币的玄学家端木老师 (@hataki108),为加密货币界的「龙头」—— 比特币(Bitcoin)—— 进行了一场深入的命盘解析。师傅从比特币的创世
-
Pump.fun高估值发币引争议,市场质疑其垄断优势已不再
一、Pump估值40亿发币 7月9日Pump.fun 正式宣布推出平台代币PUMP。PUMP最大供应量为1万亿枚,根据官方披露消息33%的代币将会用于首次代币发行募资。其中私募轮与公募轮代币统一定价为
- 成交量排行
- 币种热搜榜