长推:a16z 新论文构建LLM工作流程的三个阶段
注:原文来自@indigo11发布长推。
A16Z 最新的这篇“LLM 应用的新兴架构”来自他们对 AI 初创企业中创始人与工程师的对谈总结,非常清晰的概括了现在基于大语言模型的开发模式。不过这一切非常早期,随着底层技术的发展,可能会有很大的变化。
https://a16z.com/2023/06/20/emerging-architectures-for-llm-applications/…
大家有很多方法来构建LLM,从头开始训练模型,微调开源模型,或者直接使用托管 API。这里展示的设计模式是只有在大模型中可以做到的 In-context Learning(语境学习),其工作流程可以分为三个阶段: 1. 数据预处理与嵌入 2. 提示词构建与检索 3. 提示词执行与推理。
1. Data preprocessing / embedding:这个阶段涉及存储私人数据,以便以后检索。通常情况下,文件被分成几块,通过一个嵌入模型,然后存储在一个称为矢量数据库的专门数据库中。
2. Prompt construction / retrieval:当用户提交一个查询时,应用程序会构建一系列的提示词给大语言模型。提示词通常结合了由开发者硬编码的提示模板;为得到有效输出,使用 few-shots 的方式,可以是从外部 API 检索的任何必要信息,或者是从矢量数据库检索到相关文件。
3. Prompt execution / inference::一旦提示词被编译,它们就被提交给预先训练好的 LLM 进行推理,这里包括了闭源模型的 API、开源或自我训练的模型。一些开发者还在这一阶段添加了日志、缓存和验证等系统操作。
这种模式有效地将人工智能问题变成了数据工程问题。对于相对较小的数据集,它的表现往往优于微调,或者自己训练模型。预训练的大模型代表了自互联网以来,软件中最重要的架构变化,文中列举的模式只是整合 LLM 的起点,而不是最终形态。
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代表本站的观点或立场
您可能感兴趣
-
Oasis 协议基金会启动 ROFL 主网:面向 AI 应用的 TEE 可验证链下计算框架
2024 年 7 月 2 日 — 专注于人工智能和隐私保护的 Oasis Layer 1 区块链的治理机构 Oasis 协议基金会,正式宣布推出 Runtime Offchain Logic(ROFL
-
稳定币不是Web3专属,传统企业全面入场
1.背景:稳定币需求持续增长过去,稳定币仅被视为加密世界的重要工具,主要用于链上交易和资产避险等。如今,稳定币的角色正在发生深刻转变。稳定币总市值自 2018 年年末的 6.5 亿美金,至 2025
-
亏损必赔 0费率:BitMart重构交易保障范式
2025 上半年的加密市场,是一场高波动性与用户流失压力并存的生存竞赛。据 CoinGecko 数据,大部分中心化交易所现货交易量萎缩,创下 2024 年以来最大季度跌幅。在比特币主导地位攀升的“吸血
-
不赔偿国内受害者,FTX 的破产律师自己赚了多少钱?
谁在做决定、依据何种标准行事、最终受益者又是谁?作者:Sleepy,BlockBeats2025 年 7 月 4 日,FTX 债权人代表 Sunil 在社交平台发布了一份 FTX 破产清算的文件截图,
-
Lorenzo 推出测试网产品 USD1 OTF,率先落地基于 USD1 的链上真实收益基金
深潮 TechFlow 消息,7 月 4 日,链上资产管理平台 Lorenzo 正式推出其首个 OTF(On-chain Traded Fund)测试网产品 —— USD1 OTF,也是其首个以 U
-
Matrixport:比特币或将突破关键阻力位,迈向新交易区间
深潮 TechFlow 消息,7 月 4 日,据Matrix on Target最新周度报告显示,比特币价格虽持续横盘于窄幅震荡区间,但多项技术指标和市场数据暗示其可能即将突破关键趋势线阻力,迈向新的
-
AI赛道下一个大叙事?盘点值得关注的vibe coding项目
今年初开始,「vibe coding 氛围编码」逐渐成为 AI 圈热门的讨论方向之一。而在币圈,随着比特币保持强势,大家对于山寨季的渴望也愈来愈强。币圈的 AI 赛道经过 AI meme 和 AI A
-
Hotcoin Research | 链上炒股时代来临:股票代币化热潮解析与展望
本文将围绕股票代币化的基本原理、优势、代表平台以及其对加密市场和传统金融格局的影响展开详细解析,并探讨股票代币化未来可能的发展路径。作者:Hotcoin Research一、引言随着加密资产ETF和R
- 成交量排行
- 币种热搜榜