开云体育并对经典Transformer中枢组件进行了重构-开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口

9月12日,通义发布下一代基础模子架构Qwen3-Next。Qwen3-Next针对大模子在高下文长度和总参数两方面握住扩张(Scaling)的将来趋势而遐想,接收全新的高稀罕MoE架构,并对经典Transformer中枢组件进行了重构,革命线性详确力和自研的门控详确力计划的搀杂详确力机制,终显著模子锻真金不怕火和推理的双重性价比粗疏。
基于这一新架构,阿里通义“打样”了Qwen3-Next-80B-A3B系列模子,开源提醒(Instruct)和推理(Thinking)两大模子版块。新模子总参数 80B 仅激活 3B,性能可比好意思千问3旗舰版235B模子,模子谋略后果大幅普及。Qwen3-Next锻真金不怕火本钱较密集模子Qwen3-32B大降超90%,长文本推理微辞量普及10倍以上,并可复旧百万Tokens超长高下文。
