qwen3.6-flash

qwen3.6-flash

Qwen3.6原生视觉语言系列Flash模型,模型效果相较3.5-Flash显著提升。
2026-04-17
语言大模型
Model capability: imageModel capability: videoModel capability: thinkingModel capability: function_call
输入:
$0.19/1M tokens
输出:
$1.13/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

Qwen3.6-Flash 是通义千问系列中主打“瞬时响应”与“极致能效”的轻量化模型。它在保持 Qwen 家族优异语义理解与指令遵循能力的前提下,通过极致的模型轻量化设计,将推理延迟降低至毫秒级。

───────────────────────────────────────────────────────────────────

核心能力

极致的推理速度: 专为高频调用场景打造,通过精简的模型链路与高效的架构,实现了“秒出内容”的极速体验,完美适配实时聊天、流式交互等业务。

超高的并发吞吐能力: 凭借轻量化的体积,能够在单位算力成本下支持远超同级别模型的并发请求量,大幅降低大规模 AI 业务的运营门槛。

高水准的指令遵循: 虽为“Flash”版本,但依然继承了 Qwen 系列强大的基础逻辑能力,在结构化数据抽取、内容概括及快速问答任务中,表现出惊人的准确度。

灵活的应用集成: 得益于低资源占用特性,Qwen3.6-Flash 能够丝滑嵌入各种 API 工作流、移动端应用及边缘设备中,满足多样化的产品化部署需求。


Playground

登录后,探索更多精彩功能! 点击登录

API列表 (1)

API描述接口地址请求方法稳定性参数说明
qwen3.6-flash
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

qwen3.6-flash

Input <= 256k
1000000

输入$0.17 / 1M tokens
输出$1.03 / 1M tokens

输入$0.19/ 1M tokens
输出$1.13/ 1M tokens
10%

qwen3.6-flash

Input 256K-1M
1000000

输入$0.69 / 1M tokens
输出$4.11 / 1M tokens

输入$0.76/ 1M tokens
输出$4.52/ 1M tokens
10%