qwen3.6-35b-a3b

qwen3.6-35b-a3b

Qwen3.6系列35B-A3B原生视觉语言模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型
2026-04-17
语言大模型
Model capability: imageModel capability: videoModel capability: thinkingModel capability: function_call
输入:
$0.28/1M tokens
输出:
$1.7/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

Qwen3.6-35B-A3B 是通义千问系列中引入 MoE(Mixture of Experts)架构的杰出代表。它通过将 350 亿参数(35B)深度解耦,在处理复杂推理任务时,仅动态激活其中的 30 亿参数(3B)。这种架构设计使其拥有了接近大型模型(35B)的深度认知与逻辑深度,同时保持了微型模型(3B)的推理速度与极低延迟。

───────────────────────────────────────────────────────────────────

核心能力

极致的“大模型智力,小模型功耗”: 35B 的模型容量赋予其强大的知识储备与复杂逻辑解析能力,而 3B 的激活机制确保了其在运行时的灵活性与极速表现。

动态算力分配: MoE 架构能够根据输入的复杂程度,自主选择调动不同的“专家神经元”,从而实现对各类任务(代码、创意、逻辑)的精准适配与高效处理。

卓越的工程化适配性: 相比传统的密集模型,35B-A3B 在显存占用与推理成本上具有显著优势,能够以更低的硬件要求运行在大规模生产环境中,实现成本效益最大化。

深厚的语义与编程基因: 继承了 Qwen3.6 系列在多语言理解、代码生成及工具调用方面的顶尖实力,特别适合需要处理深度逻辑推理与结构化编程的任务。

Playground

登录后,探索更多精彩功能! 点击登录

API列表 (1)

API描述接口地址请求方法稳定性参数说明
qwen3.6-35b-a3b
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

qwen3.6-35b-a3b

Input <= 256k
256000

输入$0.26 / 1M tokens
输出$1.55 / 1M tokens

输入$0.28/ 1M tokens
输出$1.7/ 1M tokens
10%