厂商模型情况总结
✓文本生成
图图片生成
视视频生成
-不支持
开源 100
闭源 64
| 模型 | 华为云 | 火山引擎 | 阿里云 |
|---|---|---|---|
| DeepSeek-R1 | |||
| deepseek-r1-distill-qwen-14b | - | - | |
| deepseek-r1-distill-qwen-32b | - | - | |
| deepseek-r1-distill-qwen-7b | - | - | |
| DeepSeek-V3 | |||
| DeepSeek-V3.1 | |||
| DeepSeek-V3.2 | |||
| deepseek-v3.2-exp | - | - | |
| DeepSeek-V4-Flash | - | ||
| DeepSeek-V4-Pro | - | - | |
| Qwen-Image | - | - | |
| Qwen-Image-Edit | - | - | |
| Qwen2.5-14B-Instruct | - | - | |
| Qwen2.5-14B-Instruct-1m | - | - | |
| Qwen2.5-32B-Instruct | - | - | |
| Qwen2.5-3B-Instruct | - | - | |
| Qwen2.5-72B-Instruct | - | - | |
| Qwen2.5-7B-Instruct | - | - | |
| Qwen2.5-7B-Instruct-1m | - | - | |
| Qwen2.5-Coder-14B-Instruct | - | - |
厂商价格表
价格单位:文本模型按元/百万Tokens展示;图片/视频保留元/次、元/张、元/秒等原始单位。
模型类型:
厂商:
| 厂商 | 模型 | 计费区间 | 价格项 | 单价 | 单位 |
|---|---|---|---|---|---|
| DeepSeek-R1 | - | 输入 | 4 | 元/百万Tokens | |
| 输出 | 16 | 元/百万Tokens | |||
| DeepSeek-V3 | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 8 | 元/百万Tokens | |||
| DeepSeek-V3.1 | - | 输入 | 4 | 元/百万Tokens | |
| 输出 | 12 | 元/百万Tokens | |||
| DeepSeek-V3.2 | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 3 | 元/百万Tokens | |||
| DeepSeek-V4-Flash | - | 输入 | 1 | 元/百万Tokens | |
| 输出 | 2 | 元/百万Tokens | |||
| Qwen3-235B-A22B | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 8 | 元/百万Tokens | |||
| 思考输出 | 20 | 元/百万Tokens | |||
| Qwen3-30B-A3B | - | 输入 | 0.75 | 元/百万Tokens | |
| 输出 | 3 | 元/百万Tokens | |||
| 思考输出 | 7.5 | 元/百万Tokens | |||
| Qwen3-32B | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 8 | 元/百万Tokens | |||
| 思考输出 | 20 | 元/百万Tokens | |||
| Qwen3-Coder-480B-A35B-Instruct | 0<Token≤32K | 输入 | 6 | 元/百万Tokens | |
| 输出 | 24 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 9 | 元/百万Tokens | ||
| 输出 | 36 | 元/百万Tokens | |||
| GLM-5 | 0<Token≤32K | 输入 | 4 | 元/百万Tokens | |
| 输出 | 18 | 元/百万Tokens | |||
| 32K<Token≤198K | 输入 | 6 | 元/百万Tokens | ||
| 输出 | 22 | 元/百万Tokens | |||
| GLM-5.1 | 0<Token≤32K | 输入 | 6 | 元/百万Tokens | |
| 输出 | 24 | 元/百万Tokens | |||
| 32K<Token≤200K | 输入 | 8 | 元/百万Tokens | ||
| 输出 | 28 | 元/百万Tokens | |||
| Kimi-K2 | - | 输入 | 4 | 元/百万Tokens | |
| 输出 | 16 | 元/百万Tokens | |||
| Kimi-K2.6 | - | 输入 | 6.5 | 元/百万Tokens | |
| 输出 | 27 | 元/百万Tokens | |||
| LongCat-Flash-Chat | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 8 | 元/百万Tokens | |||
| DeepSeek-R1 | - | 输入 | 4 | 元/百万Tokens | |
| 输出 | 16 | 元/百万Tokens | |||
| 缓存输入 | 0.8 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| DeepSeek-V3 | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 8 | 元/百万Tokens | |||
| 缓存输入 | 0.4 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| DeepSeek-V3.1 | - | 输入 | 4 | 元/百万Tokens | |
| 输出 | 12 | 元/百万Tokens | |||
| 缓存输入 | 0.8 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| DeepSeek-V3.2 | 0<Token≤32K | 输入 | 2 | 元/百万Tokens | |
| 输出 | 3 | 元/百万Tokens | |||
| 缓存输入 | 0.4 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 4 | 元/百万Tokens | ||
| 输出 | 6 | 元/百万Tokens | |||
| 缓存输入 | 0.4 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| GLM-4.7 | 0<Token≤32K 输出长度 (0.2,+∞) 千Token | 输入 | 3 | 元/百万Tokens | |
| 输出 | 14 | 元/百万Tokens | |||
| 缓存输入 | 0.6 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 0<Token≤32K 输出长度 [0, 0.2] 千Token | 输入 | 2 | 元/百万Tokens | ||
| 输出 | 8 | 元/百万Tokens | |||
| 缓存输入 | 0.4 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 32K<Token≤200K | 输入 | 4 | 元/百万Tokens | ||
| 输出 | 16 | 元/百万Tokens | |||
| 缓存输入 | 0.8 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| doubao-1.5-lite-32k | - | 输入 | 0.3 | 元/百万Tokens | |
| 输出 | 0.6 | 元/百万Tokens | |||
| 缓存输入 | 0.06 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| doubao-1.5-pro-32k | - | 输入 | 0.8 | 元/百万Tokens | |
| 输出 | 2 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| doubao-1.5-vision-pro | - | 输入 | 3 | 元/百万Tokens | |
| 输出 | 9 | 元/百万Tokens | |||
| doubao-seed-1.6 | 0<Token≤32K 输出长度 (0.2,+∞) 千Token | 输入 | 0.8 | 元/百万Tokens | |
| 输出 | 8 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 0<Token≤32K 输出长度 [0, 0.2] 千Token | 输入 | 0.8 | 元/百万Tokens | ||
| 输出 | 2 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 1.2 | 元/百万Tokens | ||
| 输出 | 16 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 2.4 | 元/百万Tokens | ||
| 输出 | 24 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| doubao-seed-1.6-flash | 0<Token≤32K | 输入 | 0.15 | 元/百万Tokens | |
| 输出 | 1.5 | 元/百万Tokens | |||
| 缓存输入 | 0.03 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 0.3 | 元/百万Tokens | ||
| 输出 | 3 | 元/百万Tokens | |||
| 缓存输入 | 0.03 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 0.6 | 元/百万Tokens | ||
| 输出 | 6 | 元/百万Tokens | |||
| 缓存输入 | 0.03 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| doubao-seed-1.6-lite | 0<Token≤32K 输出长度 (0.2,+∞) 千Token | 输入 | 0.3 | 元/百万Tokens | |
| 输出 | 2.4 | 元/百万Tokens | |||
| 缓存输入 | 0.06 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 0<Token≤32K 输出长度 [0, 0.2] 千Token | 输入 | 0.3 | 元/百万Tokens | ||
| 输出 | 0.6 | 元/百万Tokens | |||
| 缓存输入 | 0.06 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 0.6 | 元/百万Tokens | ||
| 输出 | 4 | 元/百万Tokens | |||
| 缓存输入 | 0.06 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 1.2 | 元/百万Tokens | ||
| 输出 | 12 | 元/百万Tokens | |||
| 缓存输入 | 0.06 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| doubao-seed-1.6-vision | 0<Token≤32K | 输入 | 0.8 | 元/百万Tokens | |
| 输出 | 8 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 1.2 | 元/百万Tokens | ||
| 输出 | 16 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 2.4 | 元/百万Tokens | ||
| 输出 | 24 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| doubao-seed-1.8 | 0<Token≤32K 输出长度 (0.2,+∞) 千Token | 输入 | 0.8 | 元/百万Tokens | |
| 输出 | 8 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 0<Token≤32K 输出长度 [0, 0.2] 千Token | 输入 | 0.8 | 元/百万Tokens | ||
| 输出 | 2 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 1.2 | 元/百万Tokens | ||
| 输出 | 16 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 2.4 | 元/百万Tokens | ||
| 输出 | 24 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| doubao-seed-2.0-code | 0<Token≤32K | 输入 | 3.2 | 元/百万Tokens | |
| 输出 | 16 | 元/百万Tokens | |||
| 缓存输入 | 0.64 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 4.8 | 元/百万Tokens | ||
| 输出 | 24 | 元/百万Tokens | |||
| 缓存输入 | 0.96 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 9.6 | 元/百万Tokens | ||
| 输出 | 48 | 元/百万Tokens | |||
| 缓存输入 | 1.92 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| doubao-seed-2.0-lite | 0<Token≤32K | 输入 | 0.6 | 元/百万Tokens | |
| 输出 | 3.6 | 元/百万Tokens | |||
| 缓存输入 | 0.12 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 0.9 | 元/百万Tokens | ||
| 输出 | 5.4 | 元/百万Tokens | |||
| 缓存输入 | 0.18 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 1.8 | 元/百万Tokens | ||
| 输出 | 10.8 | 元/百万Tokens | |||
| 缓存输入 | 0.36 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| doubao-seed-2.0-mini | 0<Token≤32K | 输入 | 0.2 | 元/百万Tokens | |
| 输出 | 2 | 元/百万Tokens | |||
| 缓存输入 | 0.04 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 0.4 | 元/百万Tokens | ||
| 输出 | 4 | 元/百万Tokens | |||
| 缓存输入 | 0.08 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 0.8 | 元/百万Tokens | ||
| 输出 | 8 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| doubao-seed-2.0-pro | 0<Token≤32K | 输入 | 3.2 | 元/百万Tokens | |
| 输出 | 16 | 元/百万Tokens | |||
| 缓存输入 | 0.64 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 4.8 | 元/百万Tokens | ||
| 输出 | 24 | 元/百万Tokens | |||
| 缓存输入 | 0.96 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 9.6 | 元/百万Tokens | ||
| 输出 | 48 | 元/百万Tokens | |||
| 缓存输入 | 1.92 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| doubao-seed-character | 0<Token≤32K | 输入 | 0.8 | 元/百万Tokens | |
| 输出 | 2 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 1.2 | 元/百万Tokens | ||
| 输出 | 6 | 元/百万Tokens | |||
| 缓存输入 | 0.16 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| doubao-seed-code | 0<Token≤32K | 输入 | 1.2 | 元/百万Tokens | |
| 输出 | 8 | 元/百万Tokens | |||
| 缓存输入 | 0.24 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 1.4 | 元/百万Tokens | ||
| 输出 | 12 | 元/百万Tokens | |||
| 缓存输入 | 0.24 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 2.8 | 元/百万Tokens | ||
| 输出 | 16 | 元/百万Tokens | |||
| 缓存输入 | 0.24 | 元/百万Tokens | |||
| 缓存存储 | 0.017 | 元/百万Tokens | |||
| doubao-seed-translation | - | 输入 | 1.2 | 元/百万Tokens | |
| 输出 | 3.6 | 元/百万Tokens | |||
| DeepSeek-R1 | - | 输入 | 4 | 元/百万Tokens | |
| 输出 | 16 | 元/百万Tokens | |||
| deepseek-r1-distill-qwen-14b | - | 输入 | 1 | 元/百万Tokens | |
| 输出 | 3 | 元/百万Tokens | |||
| deepseek-r1-distill-qwen-32b | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 6 | 元/百万Tokens | |||
| deepseek-r1-distill-qwen-7b | - | 输入 | 0.5 | 元/百万Tokens | |
| 输出 | 1 | 元/百万Tokens | |||
| DeepSeek-V3 | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 8 | 元/百万Tokens | |||
| DeepSeek-V3.1 | - | 输入 | 4 | 元/百万Tokens | |
| 输出 | 12 | 元/百万Tokens | |||
| DeepSeek-V3.2 | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 3 | 元/百万Tokens | |||
| deepseek-v3.2-exp | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 3 | 元/百万Tokens | |||
| DeepSeek-V4-Flash | - | 输入 | 1 | 元/百万Tokens | |
| 输出 | 2 | 元/百万Tokens | |||
| DeepSeek-V4-Pro | - | 输入 | 12 | 元/百万Tokens | |
| 输出 | 24 | 元/百万Tokens | |||
| qwen-coder-plus | - | 输入 | 3.5 | 元/百万Tokens | |
| 输出 | 7 | 元/百万Tokens | |||
| qwen-coder-turbo | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 6 | 元/百万Tokens | |||
| qwen-deep-research | - | 输入 | 54 | 元/百万Tokens | |
| 输出 | 163 | 元/百万Tokens | |||
| qwen-doc-turbo | - | 输入 | 0.6 | 元/百万Tokens | |
| 输出 | 1 | 元/百万Tokens | |||
| qwen-flash | 0<Token≤128K | 输入 | 0.15 | 元/百万Tokens | |
| 输出 | 1.5 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 0.6 | 元/百万Tokens | ||
| 输出 | 6 | 元/百万Tokens | |||
| 256K<Token≤1M | 输入 | 1.2 | 元/百万Tokens | ||
| 输出 | 12 | 元/百万Tokens | |||
| qwen-long | - | 输入 | 0.5 | 元/百万Tokens | |
| 输出 | 2 | 元/百万Tokens | |||
| qwen-math-plus | - | 输入 | 4 | 元/百万Tokens | |
| 输出 | 12 | 元/百万Tokens | |||
| qwen-math-turbo | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 6 | 元/百万Tokens | |||
| qwen-max | - | 输入 | 2.4 | 元/百万Tokens | |
| 输出 | 9.6 | 元/百万Tokens | |||
| qwen-mt-flash | - | 输入 | 0.7 | 元/百万Tokens | |
| 输出 | 1.95 | 元/百万Tokens | |||
| qwen-mt-lite | - | 输入 | 0.6 | 元/百万Tokens | |
| 输出 | 1.6 | 元/百万Tokens | |||
| qwen-mt-plus | - | 输入 | 1.8 | 元/百万Tokens | |
| 输出 | 5.4 | 元/百万Tokens | |||
| qwen-mt-turbo | - | 输入 | 0.7 | 元/百万Tokens | |
| 输出 | 1.95 | 元/百万Tokens | |||
| qwen-omni-turbo | - | 输入 | 0.4 | 元/百万Tokens | |
| 输出 | 25 | 元/百万Tokens | |||
| 思考输出 | 1.5 | 元/百万Tokens | |||
| qwen-omni-turbo-realtime | - | 输入 | 1.6 | 元/百万Tokens | |
| 输出 | 25 | 元/百万Tokens | |||
| 思考输出 | 6 | 元/百万Tokens | |||
| qwen-plus | 0<Token≤128K | 输入 | 0.8 | 元/百万Tokens | |
| 输出 | 2 | 元/百万Tokens | |||
| 思考输出 | 8 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 2.4 | 元/百万Tokens | ||
| 输出 | 20 | 元/百万Tokens | |||
| 思考输出 | 24 | 元/百万Tokens | |||
| 256K<Token≤1M | 输入 | 4.8 | 元/百万Tokens | ||
| 输出 | 48 | 元/百万Tokens | |||
| 思考输出 | 64 | 元/百万Tokens | |||
| qwen-turbo | - | 输入 | 0.3 | 元/百万Tokens | |
| 输出 | 0.6 | 元/百万Tokens | |||
| 思考输出 | 3 | 元/百万Tokens | |||
| qwen-vl-max | - | 输入 | 1.6 | 元/百万Tokens | |
| 输出 | 4 | 元/百万Tokens | |||
| qwen-vl-ocr | - | 输入 | 0.3 | 元/百万Tokens | |
| 输出 | 0.5 | 元/百万Tokens | |||
| qwen-vl-plus | - | 输入 | 0.8 | 元/百万Tokens | |
| 输出 | 2 | 元/百万Tokens | |||
| Qwen2.5-14B-Instruct | - | 输入 | 1 | 元/百万Tokens | |
| 输出 | 3 | 元/百万Tokens | |||
| Qwen2.5-14B-Instruct-1m | - | 输入 | 1 | 元/百万Tokens | |
| 输出 | 3 | 元/百万Tokens | |||
| Qwen2.5-32B-Instruct | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 6 | 元/百万Tokens | |||
| Qwen2.5-3B-Instruct | - | 输入 | 0.3 | 元/百万Tokens | |
| 输出 | 0.9 | 元/百万Tokens | |||
| Qwen2.5-72B-Instruct | - | 输入 | 4 | 元/百万Tokens | |
| 输出 | 12 | 元/百万Tokens | |||
| Qwen2.5-7B-Instruct | - | 输入 | 0.5 | 元/百万Tokens | |
| 输出 | 1 | 元/百万Tokens | |||
| Qwen2.5-7B-Instruct-1m | - | 输入 | 0.5 | 元/百万Tokens | |
| 输出 | 1 | 元/百万Tokens | |||
| Qwen2.5-Coder-14B-Instruct | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 6 | 元/百万Tokens | |||
| Qwen2.5-Coder-32B-Instruct | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 6 | 元/百万Tokens | |||
| Qwen2.5-Coder-7B-Instruct | - | 输入 | 1 | 元/百万Tokens | |
| 输出 | 2 | 元/百万Tokens | |||
| Qwen2.5-math-72B-Instruct | - | 输入 | 4 | 元/百万Tokens | |
| 输出 | 12 | 元/百万Tokens | |||
| Qwen2.5-math-7B-Instruct | - | 输入 | 1 | 元/百万Tokens | |
| 输出 | 2 | 元/百万Tokens | |||
| Qwen2.5-OMNI-7B | - | 输入 | 0.6 | 元/百万Tokens | |
| 输出 | 38 | 元/百万Tokens | |||
| 思考输出 | 2 | 元/百万Tokens | |||
| Qwen2.5-VL-32B-Instruct | - | 输入 | 8 | 元/百万Tokens | |
| 输出 | 24 | 元/百万Tokens | |||
| Qwen2.5-VL-3B-Instruct | - | 输入 | 1.2 | 元/百万Tokens | |
| 输出 | 3.6 | 元/百万Tokens | |||
| Qwen2.5-VL-72B-Instruct | - | 输入 | 16 | 元/百万Tokens | |
| 输出 | 48 | 元/百万Tokens | |||
| Qwen2.5-VL-7B-Instruct | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 5 | 元/百万Tokens | |||
| Qwen3-0.6B | - | 输入 | 0.3 | 元/百万Tokens | |
| 输出 | 1.2 | 元/百万Tokens | |||
| 思考输出 | 3 | 元/百万Tokens | |||
| Qwen3-1.7B | - | 输入 | 0.3 | 元/百万Tokens | |
| 输出 | 1.2 | 元/百万Tokens | |||
| 思考输出 | 3 | 元/百万Tokens | |||
| Qwen3-14B | - | 输入 | 1 | 元/百万Tokens | |
| 输出 | 4 | 元/百万Tokens | |||
| 思考输出 | 10 | 元/百万Tokens | |||
| Qwen3-235B-A22B | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 8 | 元/百万Tokens | |||
| 思考输出 | 20 | 元/百万Tokens | |||
| Qwen3-30B-A3B | - | 输入 | 0.75 | 元/百万Tokens | |
| 输出 | 3 | 元/百万Tokens | |||
| 思考输出 | 7.5 | 元/百万Tokens | |||
| Qwen3-32B | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 8 | 元/百万Tokens | |||
| 思考输出 | 20 | 元/百万Tokens | |||
| Qwen3-4B | - | 输入 | 0.3 | 元/百万Tokens | |
| 输出 | 1.2 | 元/百万Tokens | |||
| 思考输出 | 3 | 元/百万Tokens | |||
| Qwen3-8B | - | 输入 | 0.5 | 元/百万Tokens | |
| 输出 | 2 | 元/百万Tokens | |||
| 思考输出 | 5 | 元/百万Tokens | |||
| Qwen3-Coder-30B-A3B-Instruct | 0<Token≤32K | 输入 | 1.5 | 元/百万Tokens | |
| 输出 | 6 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 2.25 | 元/百万Tokens | ||
| 输出 | 9 | 元/百万Tokens | |||
| 128K<Token≤200K | 输入 | 3.75 | 元/百万Tokens | ||
| 输出 | 15 | 元/百万Tokens | |||
| Qwen3-Coder-480B-A35B-Instruct | 0<Token≤32K | 输入 | 6 | 元/百万Tokens | |
| 输出 | 24 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 9 | 元/百万Tokens | ||
| 输出 | 36 | 元/百万Tokens | |||
| 128K<Token≤200K | 输入 | 15 | 元/百万Tokens | ||
| 输出 | 60 | 元/百万Tokens | |||
| qwen3-coder-flash | 0<Token≤32K | 输入 | 1 | 元/百万Tokens | |
| 输出 | 4 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 1.5 | 元/百万Tokens | ||
| 输出 | 6 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 2.5 | 元/百万Tokens | ||
| 输出 | 10 | 元/百万Tokens | |||
| 256K<Token≤1M | 输入 | 5 | 元/百万Tokens | ||
| 输出 | 25 | 元/百万Tokens | |||
| qwen3-coder-next | 0<Token≤32K | 输入 | 1 | 元/百万Tokens | |
| 输出 | 4 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 1.5 | 元/百万Tokens | ||
| 输出 | 6 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 2.5 | 元/百万Tokens | ||
| 输出 | 10 | 元/百万Tokens | |||
| qwen3-coder-plus | 0<Token≤32K | 输入 | 4 | 元/百万Tokens | |
| 输出 | 16 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 6 | 元/百万Tokens | ||
| 输出 | 24 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 10 | 元/百万Tokens | ||
| 输出 | 40 | 元/百万Tokens | |||
| 256K<Token≤1M | 输入 | 20 | 元/百万Tokens | ||
| 输出 | 200 | 元/百万Tokens | |||
| qwen3-max | 0<Token≤32K | 输入 | 2.5 | 元/百万Tokens | |
| 输出 | 10 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 4 | 元/百万Tokens | ||
| 输出 | 16 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 7 | 元/百万Tokens | ||
| 输出 | 28 | 元/百万Tokens | |||
| qwen3-max-preview | 0<Token≤32K | 输入 | 6 | 元/百万Tokens | |
| 输出 | 24 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 10 | 元/百万Tokens | ||
| 输出 | 40 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 15 | 元/百万Tokens | ||
| 输出 | 60 | 元/百万Tokens | |||
| Qwen3-Next-80B-A3B-Instruct | - | 输入 | 1 | 元/百万Tokens | |
| 输出 | 4 | 元/百万Tokens | |||
| Qwen3-Next-80B-A3B-Thinking | - | 输入 | 1 | 元/百万Tokens | |
| 输出 | - | 元/百万Tokens | |||
| 思考输出 | 10 | 元/百万Tokens | |||
| Qwen3-OMNI-30B-A3B-captioner | - | 输入 | 15.8 | 元/百万Tokens | |
| 输出 | 12.7 | 元/百万Tokens | |||
| qwen3-omni-flash | - | 输入 | 1.8 | 元/百万Tokens | |
| 输出 | 15.8 | 元/百万Tokens | |||
| 思考输出 | 3.3 | 元/百万Tokens | |||
| qwen3-omni-flash-realtime | - | 输入 | 2.2 | 元/百万Tokens | |
| 输出 | 18.9 | 元/百万Tokens | |||
| 思考输出 | 3.9 | 元/百万Tokens | |||
| Qwen3-VL-235B-A22B-Instruct | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 8 | 元/百万Tokens | |||
| Qwen3-VL-235B-A22B-Thinking | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 20 | 元/百万Tokens | |||
| Qwen3-VL-30B-A3B-Instruct | - | 输入 | 0.75 | 元/百万Tokens | |
| 输出 | 3 | 元/百万Tokens | |||
| Qwen3-VL-30B-A3B-Thinking | - | 输入 | 0.75 | 元/百万Tokens | |
| 输出 | 7.5 | 元/百万Tokens | |||
| Qwen3-VL-32B-Instruct | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 8 | 元/百万Tokens | |||
| Qwen3-VL-32B-Thinking | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 20 | 元/百万Tokens | |||
| Qwen3-VL-8B-Instruct | - | 输入 | 0.5 | 元/百万Tokens | |
| 输出 | 2 | 元/百万Tokens | |||
| Qwen3-VL-8B-Thinking | - | 输入 | 0.5 | 元/百万Tokens | |
| 输出 | 5 | 元/百万Tokens | |||
| qwen3-vl-flash | 0<Token≤32K | 输入 | 0.15 | 元/百万Tokens | |
| 输出 | 1.5 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 0.3 | 元/百万Tokens | ||
| 输出 | 3 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 0.6 | 元/百万Tokens | ||
| 输出 | 6 | 元/百万Tokens | |||
| qwen3-vl-plus | 0<Token≤32K | 输入 | 1 | 元/百万Tokens | |
| 输出 | 10 | 元/百万Tokens | |||
| 32K<Token≤128K | 输入 | 1.5 | 元/百万Tokens | ||
| 输出 | 15 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 3 | 元/百万Tokens | ||
| 输出 | 30 | 元/百万Tokens | |||
| Qwen3.5-122B-A10B | 0<Token≤128K | 输入 | 0.8 | 元/百万Tokens | |
| 输出 | 6.4 | 元/百万Tokens | |||
| 思考输出 | 6.4 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 2 | 元/百万Tokens | ||
| 输出 | 16 | 元/百万Tokens | |||
| 思考输出 | 16 | 元/百万Tokens | |||
| Qwen3.5-27B | 0<Token≤128K | 输入 | 0.6 | 元/百万Tokens | |
| 输出 | 4.8 | 元/百万Tokens | |||
| 思考输出 | 4.8 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 1.8 | 元/百万Tokens | ||
| 输出 | 14.4 | 元/百万Tokens | |||
| 思考输出 | 14.4 | 元/百万Tokens | |||
| Qwen3.5-35B-A3B | 0<Token≤128K | 输入 | 0.4 | 元/百万Tokens | |
| 输出 | 3.2 | 元/百万Tokens | |||
| 思考输出 | 3.2 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 1.6 | 元/百万Tokens | ||
| 输出 | 12.8 | 元/百万Tokens | |||
| 思考输出 | 12.8 | 元/百万Tokens | |||
| Qwen3.5-397B-A17B | 0<Token≤128K | 输入 | 1.2 | 元/百万Tokens | |
| 输出 | 7.2 | 元/百万Tokens | |||
| 思考输出 | 7.2 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 3 | 元/百万Tokens | ||
| 输出 | 18 | 元/百万Tokens | |||
| 思考输出 | 18 | 元/百万Tokens | |||
| qwen3.5-flash | 0<Token≤128K | 输入 | 0.2 | 元/百万Tokens | |
| 输出 | 2 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 0.8 | 元/百万Tokens | ||
| 输出 | 8 | 元/百万Tokens | |||
| 256K<Token≤1M | 输入 | 1.2 | 元/百万Tokens | ||
| 输出 | 12 | 元/百万Tokens | |||
| qwen3.5-omni-flash | - | 输入 | 2.2 | 元/百万Tokens | |
| 输出 | 18 | 元/百万Tokens | |||
| 思考输出 | 13.3 | 元/百万Tokens | |||
| qwen3.5-omni-flash-realtime | - | 输入 | 3.3 | 元/百万Tokens | |
| 输出 | 27 | 元/百万Tokens | |||
| 思考输出 | 20 | 元/百万Tokens | |||
| qwen3.5-omni-plus | - | 输入 | 7 | 元/百万Tokens | |
| 输出 | 53 | 元/百万Tokens | |||
| 思考输出 | 40 | 元/百万Tokens | |||
| qwen3.5-omni-plus-realtime | - | 输入 | 10 | 元/百万Tokens | |
| 输出 | 80 | 元/百万Tokens | |||
| 思考输出 | 60 | 元/百万Tokens | |||
| qwen3.5-plus | 0<Token≤128K | 输入 | 0.8 | 元/百万Tokens | |
| 输出 | 4.8 | 元/百万Tokens | |||
| 思考输出 | 4.8 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 2 | 元/百万Tokens | ||
| 输出 | 12 | 元/百万Tokens | |||
| 思考输出 | 12 | 元/百万Tokens | |||
| 256K<Token≤1M | 输入 | 4 | 元/百万Tokens | ||
| 输出 | 24 | 元/百万Tokens | |||
| 思考输出 | 24 | 元/百万Tokens | |||
| Qwen3.6-27B | 0<Token≤256K | 输入 | 3 | 元/百万Tokens | |
| 输出 | 18 | 元/百万Tokens | |||
| 思考输出 | 18 | 元/百万Tokens | |||
| Qwen3.6-35B-A3B | 0<Token≤256K | 输入 | 1.8 | 元/百万Tokens | |
| 输出 | 10.8 | 元/百万Tokens | |||
| 思考输出 | 10.8 | 元/百万Tokens | |||
| qwen3.6-flash | 0<Token≤256K | 输入 | 1.2 | 元/百万Tokens | |
| 输出 | 7.2 | 元/百万Tokens | |||
| 256K<Token≤1M | 输入 | 4.8 | 元/百万Tokens | ||
| 输出 | 28.8 | 元/百万Tokens | |||
| qwen3.6-max-preview | 0<Token≤128K | 输入 | 9 | 元/百万Tokens | |
| 输出 | 54 | 元/百万Tokens | |||
| 128K<Token≤256K | 输入 | 15 | 元/百万Tokens | ||
| 输出 | 90 | 元/百万Tokens | |||
| qwen3.6-plus | 0<Token≤256K | 输入 | 2 | 元/百万Tokens | |
| 输出 | 12 | 元/百万Tokens | |||
| 思考输出 | 12 | 元/百万Tokens | |||
| 256K<Token≤1M | 输入 | 8 | 元/百万Tokens | ||
| 输出 | 48 | 元/百万Tokens | |||
| 思考输出 | 48 | 元/百万Tokens | |||
| QwQ-32B | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 6 | 元/百万Tokens | |||
| QwQ-32B-Preview | - | 输入 | 2 | 元/百万Tokens | |
| 输出 | 6 | 元/百万Tokens | |||
| qwq-plus | - | 输入 | 1.6 | 元/百万Tokens | |
| 输出 | 4 | 元/百万Tokens | |||
| glm-4.5 | 0<Token≤32K | 输入 | 3 | 元/百万Tokens | |
| 输出 | 14 | 元/百万Tokens | |||
| 32K<Token≤96K | 输入 | 4 | 元/百万Tokens | ||
| 输出 | 16 | 元/百万Tokens | |||
| GLM-4.5-Air | 0<Token≤32K | 输入 | 0.8 | 元/百万Tokens | |
| 输出 | 6 | 元/百万Tokens | |||
| 32K<Token≤96K | 输入 | 1.2 | 元/百万Tokens | ||
| 输出 | 8 | 元/百万Tokens | |||
| glm-4.6 | 0<Token≤32K | 输入 | 3 | 元/百万Tokens | |
| 输出 | 14 | 元/百万Tokens | |||
| 32K<Token≤166K | 输入 | 4 | 元/百万Tokens | ||
| 输出 | 16 | 元/百万Tokens | |||
| GLM-4.7 | 0<Token≤32K | 输入 | 3 | 元/百万Tokens | |
| 输出 | 14 | 元/百万Tokens | |||
| 32K<Token≤166K | 输入 | 4 | 元/百万Tokens | ||
| 输出 | 16 | 元/百万Tokens | |||
| GLM-5 | 0<Token≤32K | 输入 | 4 | 元/百万Tokens | |
| 输出 | 18 | 元/百万Tokens | |||
| 32K<Token≤198K | 输入 | 6 | 元/百万Tokens | ||
| 输出 | 22 | 元/百万Tokens | |||
| GLM-5.1 | 0<Token≤32K | 输入 | 6 | 元/百万Tokens | |
| 输出 | 24 | 元/百万Tokens | |||
| 32K<Token≤200K | 输入 | 8 | 元/百万Tokens | ||
| 输出 | 28 | 元/百万Tokens | |||
| Kimi-K2 | - | 输入 | 4 | 元/百万Tokens | |
| 输出 | 16 | 元/百万Tokens | |||
| kimi-k2-thinking | - | 输入 | 4 | 元/百万Tokens | |
| 输出 | 16 | 元/百万Tokens | |||
| Kimi-K2.5 | - | 输入 | 4 | 元/百万Tokens | |
| 输出 | 21 | 元/百万Tokens | |||
| Kimi-K2.6 | - | 输入 | 6.5 | 元/百万Tokens | |
| 输出 | 27 | 元/百万Tokens | |||
| Moonshot-Kimi-K2-Instruct | - | 输入 | 4 | 元/百万Tokens | |
| 输出 | 16 | 元/百万Tokens | |||
| Qwen-Image | - | 单价 | 0.25 | 元/次 | |
| Qwen-Image-Edit | - | 单价 | 0.3 | 元/次 | |
| Seedream-3.0 | - | 单价 | 0.259 | 元/张 | |
| Seedream-4.0 | - | 单价 | 0.2 | 元/张 | |
| Seedream-4.5 | - | 单价 | 0.25 | 元/张 | |
| Seedream-5.0-Lite | - | 单价 | 0.22 | 元/张 | |
| wan2.2-t2i-flash | - | 单价 | 0.14 | 元/次 | |
| wan2.2-t2i-plus | - | 单价 | 0.2 | 元/次 | |
| wan2.5-t2i-preview | - | 单价 | 0.2 | 元/次 | |
| wan2.6-t2i | - | 单价 | 0.2 | 元/次 | |
| wanx-background-generation-v2 | - | 单价 | 0.08 | 元/次 | |
| wanx-sketch-to-image-lite | - | 单价 | 0.06 | 元/次 | |
| wanx-style-repaint-v1 | - | 单价 | 0.12 | 元/次 | |
| wanx-v1 | - | 单价 | 0.16 | 元/次 | |
| wanx2.0-t2i-turbo | - | 单价 | 0.04 | 元/次 | |
| wanx2.1-imageedit | - | 单价 | 0.14 | 元/次 | |
| wanx2.1-t2i-plus | - | 单价 | 0.2 | 元/次 | |
| wanx2.1-t2i-turbo | - | 单价 | 0.14 | 元/次 | |
| Wan2.2-I2V-A14B | - | 单价 | 0.005 | 元/千Tokens | |
| Wan2.2-T2V-A14B | - | 单价 | 0.005 | 元/千Tokens | |
| Seedance-1.0-Lite | - | 单价 | 0.01 | 元/千Tokens | |
| Seedance-1.0-Pro | - | 单价 | 0.015 | 元/千Tokens | |
| Seedance-1.0-Pro-Fast | - | 单价 | 0.0042 | 元/千Tokens | |
| Seedance-1.5-Pro | 按输出视频是否包含声音区分定价,无声视频 | 单价 | 0.008 | 元/千Tokens | |
| 按输出视频是否包含声音区分定价,有声视频 | 单价 | 0.016 | 元/千Tokens | ||
| Seedance-2.0 | 按输出视频分辨率和输入是否包含视频区分定价,输出视频分辨率为 1080p,输入不含视频 | 单价 | 0.051 | 元/千Tokens | |
| 按输出视频分辨率和输入是否包含视频区分定价,输出视频分辨率为 1080p,输入包含视频 | 单价 | 0.031 | 元/千Tokens | ||
| 按输出视频分辨率和输入是否包含视频区分定价,输出视频分辨率为 480p,720p,输入不含视频 | 单价 | 0.046 | 元/千Tokens | ||
| 按输出视频分辨率和输入是否包含视频区分定价,输出视频分辨率为 480p,720p,输入包含视频 | 单价 | 0.028 | 元/千Tokens | ||
| Seedance-2.0-Fast | 按输入是否包含视频区分定价,不支持输出 1080p 视频,输入不含视频 | 单价 | 0.037 | 元/千Tokens | |
| 按输入是否包含视频区分定价,不支持输出 1080p 视频,输入包含视频 | 单价 | 0.022 | 元/千Tokens | ||
| wan2.2-i2v-flash | - | 单价 | 0.1 | 元/秒 | |
| wan2.2-i2v-plus | - | 单价 | 0.14 | 元/秒 | |
| wan2.2-kf2v-flash | - | 单价 | 0.1 | 元/秒 | |
| wan2.2-t2v-plus | - | 单价 | 0.14 | 元/秒 | |
| wan2.5-i2v-preview | - | 单价 | 0.3 | 元/秒 | |
| wan2.5-t2v-preview | - | 单价 | 0.3 | 元/秒 | |
| wan2.6-i2v | - | 单价 | 0.6 | 元/秒 | |
| wan2.6-t2v | - | 单价 | 0.6 | 元/秒 | |
| wan2.7-i2v | - | 单价 | 0.6 | 元/秒 | |
| wan2.7-t2v | - | 单价 | 0.6 | 元/秒 | |
| wanx2.1-i2v-plus | - | 单价 | 0.7 | 元/秒 | |
| wanx2.1-i2v-turbo | - | 单价 | 0.24 | 元/秒 | |
| wanx2.1-kf2v-plus | - | 单价 | 0.7 | 元/秒 | |
| wanx2.1-t2v-plus | - | 单价 | 0.7 | 元/秒 | |
| wanx2.1-t2v-turbo | - | 单价 | 0.24 | 元/秒 | |
| wanx2.1-vace-plus | - | 单价 | 0.7 | 元/秒 |
阿里云缓存价格说明:
显式缓存:创建缓存的Token按输入Token标准单价的125%计费,后续命中仅需支付10%的费用。
隐式缓存:自动模式,对命中缓存的部分按输入Token标准单价的20%计费。
详情→
同模型跨厂商价格对比
说明:本表只对比开源模型。
价格单位:元/百万Tokens
最低价
中间价
最高价
| 模型 | 计费区间 | 价格项 | 单位 | 华为云 | 火山引擎 | 阿里云 |
|---|---|---|---|---|---|---|
| DeepSeek-R1 | - | 输入 | 元/百万Tokens | 4 | 4 | 4 |
| 输出 | 16 | 16 | 16 | |||
| deepseek-r1-distill-qwen-14b | - | 输入 | 元/百万Tokens | - | - | 1 |
| 输出 | - | - | 3 | |||
| deepseek-r1-distill-qwen-32b | - | 输入 | 元/百万Tokens | - | - | 2 |
| 输出 | - | - | 6 | |||
| deepseek-r1-distill-qwen-7b | - | 输入 | 元/百万Tokens | - | - | 0.5 |
| 输出 | - | - | 1 | |||
| DeepSeek-V3 | - | 输入 | 元/百万Tokens | 2 | 2 | 2 |
| 输出 | 8 | 8 | 8 | |||
| DeepSeek-V3.1 | - | 输入 | 元/百万Tokens | 4 | 4 | 4 |
| 输出 | 12 | 12 | 12 | |||
| DeepSeek-V3.2 | 0<Token≤32K | 输入 | 元/百万Tokens | 2 | 2 | 2 |
| 输出 | 3 | 3 | 3 | |||
| 32K<Token≤128K | 输入 | 元/百万Tokens | 2 | 4 | 2 | |
| 输出 | 3 | 6 | 3 | |||
| deepseek-v3.2-exp | - | 输入 | 元/百万Tokens | - | - | 2 |
| 输出 | - | - | 3 | |||
| DeepSeek-V4-Flash | - | 输入 | 元/百万Tokens | 1 | - | 1 |
| 输出 | 2 | - | 2 | |||
| DeepSeek-V4-Pro | - | 输入 | 元/百万Tokens | - | - | 12 |
| 输出 | - | - | 24 | |||
| Qwen2.5-14B-Instruct | - | 输入 | 元/百万Tokens | - | - | 1 |
| 输出 | - | - | 3 | |||
| Qwen2.5-14B-Instruct-1m | - | 输入 | 元/百万Tokens | - | - | 1 |
| 输出 | - | - | 3 | |||
| Qwen2.5-32B-Instruct | - | 输入 | 元/百万Tokens | - | - | 2 |
| 输出 | - | - | 6 | |||
| Qwen2.5-3B-Instruct | - | 输入 | 元/百万Tokens | - | - | 0.3 |
| 输出 | - | - | 0.9 | |||
| Qwen2.5-72B-Instruct | - | 输入 | 元/百万Tokens | - | - | 4 |
| 输出 | - | - | 12 | |||
| Qwen2.5-7B-Instruct | - | 输入 | 元/百万Tokens | - | - | 0.5 |
| 输出 | - | - | 1 | |||
| Qwen2.5-7B-Instruct-1m | - | 输入 | 元/百万Tokens | - | - | 0.5 |
| 输出 | - | - | 1 | |||
| Qwen2.5-Coder-14B-Instruct | - | 输入 | 元/百万Tokens | - | - | 2 |
| 输出 | - | - | 6 | |||
| Qwen2.5-Coder-32B-Instruct | - | 输入 | 元/百万Tokens | - | - | 2 |
| 输出 | - | - | 6 | |||
| Qwen2.5-Coder-7B-Instruct | - | 输入 | 元/百万Tokens | - | - | 1 |
| 输出 | - | - | 2 | |||
| Qwen2.5-math-72B-Instruct | - | 输入 | 元/百万Tokens | - | - | 4 |
| 输出 | - | - | 12 | |||
| Qwen2.5-math-7B-Instruct | - | 输入 | 元/百万Tokens | - | - | 1 |
| 输出 | - | - | 2 | |||
| Qwen2.5-OMNI-7B | - | 输入 | 元/百万Tokens | - | - | 0.6 |
| 输出 | - | - | 38 | |||
| 思考输出 | - | - | 2 | |||
| Qwen2.5-VL-32B-Instruct | - | 输入 | 元/百万Tokens | - | - | 8 |
| 输出 | - | - | 24 | |||
| Qwen2.5-VL-3B-Instruct | - | 输入 | 元/百万Tokens | - | - | 1.2 |
| 输出 | - | - | 3.6 | |||
| Qwen2.5-VL-72B-Instruct | - | 输入 | 元/百万Tokens | - | - | 16 |
| 输出 | - | - | 48 | |||
| Qwen2.5-VL-7B-Instruct | - | 输入 | 元/百万Tokens | - | - | 2 |
| 输出 | - | - | 5 | |||
| Qwen3-0.6B | - | 输入 | 元/百万Tokens | - | - | 0.3 |
| 输出 | - | - | 1.2 | |||
| 思考输出 | - | - | 3 | |||
| Qwen3-1.7B | - | 输入 | 元/百万Tokens | - | - | 0.3 |
| 输出 | - | - | 1.2 | |||
| 思考输出 | - | - | 3 | |||
| Qwen3-14B | - | 输入 | 元/百万Tokens | - | - | 1 |
| 输出 | - | - | 4 | |||
| 思考输出 | - | - | 10 | |||
| Qwen3-235B-A22B | - | 输入 | 元/百万Tokens | 2 | - | 2 |
| 输出 | 8 | - | 8 | |||
| 思考输出 | 20 | - | 20 | |||
| Qwen3-30B-A3B | - | 输入 | 元/百万Tokens | 0.75 | - | 0.75 |
| 输出 | 3 | - | 3 | |||
| 思考输出 | 7.5 | - | 7.5 | |||
| Qwen3-32B | - | 输入 | 元/百万Tokens | 2 | - | 2 |
| 输出 | 8 | - | 8 | |||
| 思考输出 | 20 | - | 20 | |||
| Qwen3-4B | - | 输入 | 元/百万Tokens | - | - | 0.3 |
| 输出 | - | - | 1.2 | |||
| 思考输出 | - | - | 3 | |||
| Qwen3-8B | - | 输入 | 元/百万Tokens | - | - | 0.5 |
| 输出 | - | - | 2 | |||
| 思考输出 | - | - | 5 | |||
| Qwen3-Coder-30B-A3B-Instruct | 0<Token≤32K | 输入 | 元/百万Tokens | - | - | 1.5 |
| 输出 | - | - | 6 | |||
| 32K<Token≤128K | 输入 | 元/百万Tokens | - | - | 2.25 | |
| 输出 | - | - | 9 | |||
| 128K<Token≤200K | 输入 | 元/百万Tokens | - | - | 3.75 | |
| 输出 | - | - | 15 | |||
| Qwen3-Coder-480B-A35B-Instruct | 0<Token≤32K | 输入 | 元/百万Tokens | 6 | - | 6 |
| 输出 | 24 | - | 24 | |||
| 32K<Token≤128K | 输入 | 元/百万Tokens | 9 | - | 9 | |
| 输出 | 36 | - | 36 | |||
| 128K<Token≤200K | 输入 | 元/百万Tokens | - | - | 15 | |
| 输出 | - | - | 60 | |||
| Qwen3-Next-80B-A3B-Instruct | - | 输入 | 元/百万Tokens | - | - | 1 |
| 输出 | - | - | 4 | |||
| Qwen3-Next-80B-A3B-Thinking | - | 输入 | 元/百万Tokens | - | - | 1 |
| 输出 | - | - | - | |||
| 思考输出 | - | - | 10 | |||
| Qwen3-OMNI-30B-A3B-captioner | - | 输入 | 元/百万Tokens | - | - | 15.8 |
| 输出 | - | - | 12.7 | |||
| Qwen3-VL-235B-A22B-Instruct | - | 输入 | 元/百万Tokens | - | - | 2 |
| 输出 | - | - | 8 | |||
| Qwen3-VL-235B-A22B-Thinking | - | 输入 | 元/百万Tokens | - | - | 2 |
| 输出 | - | - | 20 | |||
| Qwen3-VL-30B-A3B-Instruct | - | 输入 | 元/百万Tokens | - | - | 0.75 |
| 输出 | - | - | 3 | |||
| Qwen3-VL-30B-A3B-Thinking | - | 输入 | 元/百万Tokens | - | - | 0.75 |
| 输出 | - | - | 7.5 | |||
| Qwen3-VL-32B-Instruct | - | 输入 | 元/百万Tokens | - | - | 2 |
| 输出 | - | - | 8 | |||
| Qwen3-VL-32B-Thinking | - | 输入 | 元/百万Tokens | - | - | 2 |
| 输出 | - | - | 20 | |||
| Qwen3-VL-8B-Instruct | - | 输入 | 元/百万Tokens | - | - | 0.5 |
| 输出 | - | - | 2 | |||
| Qwen3-VL-8B-Thinking | - | 输入 | 元/百万Tokens | - | - | 0.5 |
| 输出 | - | - | 5 | |||
| Qwen3.5-122B-A10B | 0<Token≤128K | 输入 | 元/百万Tokens | - | - | 0.8 |
| 输出 | - | - | 6.4 | |||
| 思考输出 | - | - | 6.4 | |||
| 128K<Token≤256K | 输入 | 元/百万Tokens | - | - | 2 | |
| 输出 | - | - | 16 | |||
| 思考输出 | - | - | 16 | |||
| Qwen3.5-27B | 0<Token≤128K | 输入 | 元/百万Tokens | - | - | 0.6 |
| 输出 | - | - | 4.8 | |||
| 思考输出 | - | - | 4.8 | |||
| 128K<Token≤256K | 输入 | 元/百万Tokens | - | - | 1.8 | |
| 输出 | - | - | 14.4 | |||
| 思考输出 | - | - | 14.4 | |||
| Qwen3.5-35B-A3B | 0<Token≤128K | 输入 | 元/百万Tokens | - | - | 0.4 |
| 输出 | - | - | 3.2 | |||
| 思考输出 | - | - | 3.2 | |||
| 128K<Token≤256K | 输入 | 元/百万Tokens | - | - | 1.6 | |
| 输出 | - | - | 12.8 | |||
| 思考输出 | - | - | 12.8 | |||
| Qwen3.5-397B-A17B | 0<Token≤128K | 输入 | 元/百万Tokens | - | - | 1.2 |
| 输出 | - | - | 7.2 | |||
| 思考输出 | - | - | 7.2 | |||
| 128K<Token≤256K | 输入 | 元/百万Tokens | - | - | 3 | |
| 输出 | - | - | 18 | |||
| 思考输出 | - | - | 18 | |||
| Qwen3.6-27B | 0<Token≤256K | 输入 | 元/百万Tokens | - | - | 3 |
| 输出 | - | - | 18 | |||
| 思考输出 | - | - | 18 | |||
| Qwen3.6-35B-A3B | 0<Token≤256K | 输入 | 元/百万Tokens | - | - | 1.8 |
| 输出 | - | - | 10.8 | |||
| 思考输出 | - | - | 10.8 | |||
| QwQ-32B | - | 输入 | 元/百万Tokens | - | - | 2 |
| 输出 | - | - | 6 | |||
| QwQ-32B-Preview | - | 输入 | 元/百万Tokens | - | - | 2 |
| 输出 | - | - | 6 | |||
| qwq-plus | - | 输入 | 元/百万Tokens | - | - | 1.6 |
| 输出 | - | - | 4 | |||
| glm-4.5 | 0<Token≤32K | 输入 | 元/百万Tokens | - | - | 3 |
| 输出 | - | - | 14 | |||
| 32K<Token≤96K | 输入 | 元/百万Tokens | - | - | 4 | |
| 输出 | - | - | 16 | |||
| GLM-4.5-Air | 0<Token≤32K | 输入 | 元/百万Tokens | - | - | 0.8 |
| 输出 | - | - | 6 | |||
| 32K<Token≤96K | 输入 | 元/百万Tokens | - | - | 1.2 | |
| 输出 | - | - | 8 | |||
| glm-4.6 | 0<Token≤32K | 输入 | 元/百万Tokens | - | - | 3 |
| 输出 | - | - | 14 | |||
| 32K<Token≤166K | 输入 | 元/百万Tokens | - | - | 4 | |
| 输出 | - | - | 16 | |||
| GLM-4.7 | 0<Token≤32K 输出长度 (0.2,+∞) 千Token | 输入 | 元/百万Tokens | - | 3 | 3 |
| 输出 | - | 14 | 14 | |||
| 0<Token≤32K 输出长度 [0, 0.2] 千Token | 输入 | 元/百万Tokens | - | 2 | 3 | |
| 输出 | - | 8 | 14 | |||
| 32K<Token≤166K | 输入 | 元/百万Tokens | - | 4 | 4 | |
| 输出 | - | 16 | 16 | |||
| GLM-5 | 0<Token≤32K | 输入 | 元/百万Tokens | 4 | - | 4 |
| 输出 | 18 | - | 18 | |||
| 32K<Token≤198K | 输入 | 元/百万Tokens | 6 | - | 6 | |
| 输出 | 22 | - | 22 | |||
| GLM-5.1 | 0<Token≤32K | 输入 | 元/百万Tokens | 6 | - | 6 |
| 输出 | 24 | - | 24 | |||
| 32K<Token≤200K | 输入 | 元/百万Tokens | 8 | - | 8 | |
| 输出 | 28 | - | 28 | |||
| Kimi-K2 | - | 输入 | 元/百万Tokens | 4 | - | 4 |
| 输出 | 16 | - | 16 | |||
| kimi-k2-thinking | - | 输入 | 元/百万Tokens | - | - | 4 |
| 输出 | - | - | 16 | |||
| Kimi-K2.5 | - | 输入 | 元/百万Tokens | - | - | 4 |
| 输出 | - | - | 21 | |||
| Kimi-K2.6 | - | 输入 | 元/百万Tokens | 6.5 | - | 6.5 |
| 输出 | 27 | - | 27 | |||
| LongCat-Flash-Chat | - | 输入 | 元/百万Tokens | 2 | - | - |
| 输出 | 8 | - | - |