2026 国产大模型 API 价格对比:GLM

2026 国产大模型 API 价格对比:GLM

国产模型已经不能简单归类为“便宜替代品”。现在既有极低价文本路由,也有主打长程编程、原生多模态和百万上下文的高端 Agent 模型。

真正有用的问题不是谁赢了厂商榜单,而是谁能以最低的任务总成本完成你的业务。总成本需要同时计算输出 token、缓存命中、长上下文溢价、延迟、重试次数和人工返工。

最新价格快照

美元价格使用官方国际站 API 价格;人民币价格保留人民币,不用浮动汇率伪装成官方美元价格。

模型输入 / 百万缓存输入 / 百万输出 / 百万上下文适合场景DeepSeek V4 Flash$0.14$0.0028$0.281M最低成本文本分流小米 MiMo-V2.5$0.14$0.0028$0.281M低价多模态 AgentMiniMax M3,输入不超过 512K$0.30$0.06$1.201M长上下文多模态 AgentGLM-5.1$1.40$0.26$4.40200K长程工程任务Qwen3.7 Plus,输入不超过 256K¥2未列出¥81M阿里云生产工作负载Qwen3.7 Max¥12未列出¥361M高端千问旗舰

MiniMax M3 输入超过 512K 后,输入、缓存输入和输出分别为 $0.60、$0.12 和 $2.40/M。Qwen3.7 Plus 输入在 256K 到 1M 时,输入和输出分别为 ¥6 和 ¥24/M。

这轮更新有什么不同

MiniMax M3 把超长上下文价格打下来了

MiniMax M3 于 2026 年 6 月 1 日上线,支持 1M 上下文、图片和视频输入、工具调用以及非常大的最大输出。国际站标准价格只有 $0.30/$1.20,适合长代码库、多模态 Agent 和长输出任务。

GLM-5.1 主打持续执行,不是短题跑分

Z.AI 对 GLM-5.1 的定位是长程 Coding 和 Agent 任务。它的国际站 API 单价明显高于 MiniMax、DeepSeek 和 MiMo,因此必须验证更高的完成率、更少的重试是否能覆盖价格溢价。

千问已经远不止 Qwen 2.5

Qwen3.7 Plus 和 Max 已通过阿里云百炼提供 1M 上下文。Plus 更适合作为性价比主力;Max 属于高价旗舰,只应在质量提升可以被业务评测证明时使用。

推荐路由

工作负载建议起点分类、抽取、简单工具调用DeepSeek V4 Flash成本敏感的 Coding Agent小米 MiMo-V2.5长代码库、图片/视频输入、长输出MiniMax M3多小时工程工作流GLM-5.1已经使用阿里云技术栈Qwen3.7 Plus

不要把全部流量都打到一个旗舰模型。应该测量任务成功率、总输出 token、重试次数、延迟和人工修复时间。高单价模型可能拥有更低的单任务成本,但必须由你的真实任务集证明。

可以使用 AI 模型价格计算器 对比 canonical 数据中使用美元定价的模型。

已核对官方来源:Z.AI 定价、GLM-5.1 文档、MiniMax 按量定价、MiniMax M3 发布公告、阿里云百炼模型价格、DeepSeek 定价 和 小米 MiMo 定价。

相关风雨