长推:a16z 新论文构建LLM工作流程的三个阶段
注:原文来自@indigo11发布长推。
A16Z 最新的这篇“LLM 应用的新兴架构”来自他们对 AI 初创企业中创始人与工程师的对谈总结,非常清晰的概括了现在基于大语言模型的开发模式。不过这一切非常早期,随着底层技术的发展,可能会有很大的变化。
https://a16z.com/2023/06/20/emerging-architectures-for-llm-applications/…
大家有很多方法来构建LLM,从头开始训练模型,微调开源模型,或者直接使用托管 API。这里展示的设计模式是只有在大模型中可以做到的 In-context Learning(语境学习),其工作流程可以分为三个阶段: 1. 数据预处理与嵌入 2. 提示词构建与检索 3. 提示词执行与推理。
1. Data preprocessing / embedding:这个阶段涉及存储私人数据,以便以后检索。通常情况下,文件被分成几块,通过一个嵌入模型,然后存储在一个称为矢量数据库的专门数据库中。
2. Prompt construction / retrieval:当用户提交一个查询时,应用程序会构建一系列的提示词给大语言模型。提示词通常结合了由开发者硬编码的提示模板;为得到有效输出,使用 few-shots 的方式,可以是从外部 API 检索的任何必要信息,或者是从矢量数据库检索到相关文件。
3. Prompt execution / inference::一旦提示词被编译,它们就被提交给预先训练好的 LLM 进行推理,这里包括了闭源模型的 API、开源或自我训练的模型。一些开发者还在这一阶段添加了日志、缓存和验证等系统操作。
这种模式有效地将人工智能问题变成了数据工程问题。对于相对较小的数据集,它的表现往往优于微调,或者自己训练模型。预训练的大模型代表了自互联网以来,软件中最重要的架构变化,文中列举的模式只是整合 LLM 的起点,而不是最终形态。
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代表本站的观点或立场
您可能感兴趣
-
冷知识:以太坊上第一个 DApp 就是预测市场
最初,它是一个想象力极其丰富的产品。撰文:Eric,Foresight News最近几天在整理有哪些 Web3 预测市场的时候,恍然想起了 Augur。搜索了一下相关的信息,发现 Augur 在今年
-
我为什么逐渐放弃了 Web3 项目投研?
引言 最近,我的精力大多转向了AI领域,Web3相关内容的输出也随之减少。但沉淀一年多以来,关于这个行业,我积累了许多新的心得与体会,值得与大家分享。 关注我较早的读者或许还记得,我的写作生涯始于项目
-
黄金暴走,加密雪崩:150 亿美金没收与 100% 关税下的牛市拷问
宏观政治风险已成为加密市场不可忽视的顶层变量,未来的牛市道路会更加曲折。作者:Hotcoin Research加密市场表现当前,加密货币总市值为 3.63 万亿美元,BTC占比 58.9%,为 2.1
-
Hotcoin Research | “10·11”惊魂夜复盘:从繁荣到坍塌的原因、传导、影响与展望
本文将深度解析这次暴跌的背景原因、传导机制、USDe脱锚风波、影响评估,并对2025年第四季度后续行情进行预判和展望。作者:Hotcoin Research一、引言10月11日凌晨,加密市场上演“惊魂
-
预测市场爆火之下的三大疑问:内幕交易、合规、缺少华语叙事市场
作者:Zhou, ChainCatcher预测市场在2025年持续火爆,Kalshi 与 Polymarket 在 9 月合计实现 14.4 亿美元交易量,创下历史纪录。近期两大平台均宣布完成新一轮融
-
币价倒退、市场内卷,2025 的加密太难了
无论你认为市场会创新高,还是已经进入熊市,都应该开始积累“专属知识”来为自己保驾护航。作者:Route 2 FI编译:深潮TechFlow如果你还在疑惑为什么 Crypto Twitter 上大多数人
-
Tiger Research:ICO 再次回归,新一代四大发售平台能否成功?
本报告由Tiger Research撰写,分析了公开代币销售的复苏现象,并深入考察了四大主流启动平台的运营策略,它们分别是:Legion、BuidlPad、Sonar和Kaito。 核心要点自2017
-
Ray Dalio:黄金是最成熟的货币,零配置或低配都是战略失误
与任何法定货币债务相比,黄金才是更本质的无风险资产。作者:Ray Dalio编译:金十数据近日,桥水基金(Bridgewater Associates)创始人达利欧在社交媒体分享了他对黄金的看法,以下
- 成交量排行
- 币种热搜榜


