阿里巴巴推出更高效的Qwen3-Next人工智能模型
09月
12
4小时前
币界网报道:阿里巴巴旗下通义千问发布了下一代基础模型架构Qwen3-Next,并开源了基于该架构的Qwen3-Next-80B-A3B系列模型。该结构相比Qwen3的MoE模型结构,进行了以下核心改进:混合注意力机制、高稀疏度MoE结构、一系列训练稳定友好的优化,以及提升推理效率的多token预测机制。基于Qwen3-Next的模型结构,阿里训练了Qwen3-Next-80B-A3B-Base模型,该模型拥有800亿参数仅激活30亿参数。该Base模型实现了与Qwen3-32B dense模型相近甚至略好的性能,而它的训练成本(GPU hours) 仅为Qwen3-32B的十分之一不到,在32k以上的上下文下的推理吞吐则是Qwen3-32B的十倍以上,实现了极致的训练和推理性价比。
本周焦点
推荐阅读
-
早报 | 美国 8 月非农就业增长放缓,失业率升至 2021 年最高水平;Hyperliquid 将释放 USDH 代币符号用于稳定币发行;特朗普媒体科技集团收购 CRO 流通供应量约 2%
-
早报 | 纳斯达克向美 SEC 提交申请以上架代币化股票;工银亚洲和汇丰或已申请稳定币牌照;Hyperliquid 旗下 USDH 稳定币发行权引多家机构竞逐
-
本周要闻前瞻 | 美国公布 8 月 CPI、PPI 数据;Linea 开放空投申领
-
Hotcoin Research | 起底特朗普家族加密版图:政治资本如何转化为币圈财富?
-
2025 加密监管启示录
-
⾹港需要⼀场流动性⾰命
-
阿里巴巴创始人马云间接投资以太坊:资产配置迎来“数字黄金”布局
-
DeFi小白入门宝典(一):看AAVE大户如何用1000万美金通过利差套利获得100%的APR
数字货币行情
虚拟货币
最新价($)
-
BTC-比特币
bitcoin$115308.59
+1.09% -
ETH-以太坊
ethereum$4501.74
+2.87% -
XRP-瑞波币
ripple$3.039
+1.62% -
USDT-泰达币
tether$1.0002
+0.02% -
SOL-Solana
solana$232.62
+4.06% -
BNB-币安币
binance-coin$903.17
+1.38% -
USDC-USD Coin
usdc$0.9995
-0.01% -
DOGE-狗狗币
dogecoin$0.2601
+5.52% -
TRX-波场
tron$0.3478
+1.7% -
ADA-艾达币
cardano$0.8994
+1.17% -
LINK-ChainLink
chainlink$24.5854
+3.64% -
WBTC-Wrapped Bitcoin
wrapped-bitcoin$115303.69
+1.27% -
SUI-Sui
sui$3.6572
+1.64% -
XLM-恒星币
stellar$0.393
+1.63% -
AVAX-Avalanche
avalanche$28.8624
-0.08%