模型与价格
以百万 tokens 为单位计量。Token 是模型处理文本的最小语义单元。
模型规格
| deepseek-v4-flash | deepseek-v4-pro | |
|---|---|---|
| API Base (OpenAI) | https://api.deepseek.com | |
| API Base (Anthropic) | https://api.deepseek.com/anthropic | |
| 版本 | DeepSeek-V4-Flash | DeepSeek-V4-Pro |
| 思考模式 | 非思考 / 思考(默认) | |
| 上下文 | 1,000,000 tokens | |
| 最大输出 | 384,000 tokens | |
功能支持
| 功能 | v4-flash | v4-pro |
|---|---|---|
| JSON Output | Y | Y |
| Tool Calls | Y | Y |
| Prefix Completion (Beta) | Y | Y |
| FIM (Beta) | 非思考模式 | 非思考模式 |
定价(每百万 tokens)
| 计费项 | v4-flash | v4-pro |
|---|---|---|
| 输入(缓存命中) | 0.02 元 | 0.025 元 |
| 输入(缓存未命中) | 1 元 | 3 元 |
| 输出 | 2 元 | 6 元 |
并发限制
| 模型 | 并发上限 |
|---|---|
| deepseek-v4-flash | 2,500 |
| deepseek-v4-pro | 500 |
* deepseek-chat / deepseek-reasoner 将于 2026/07/24 弃用,分别映射至 v4-flash 非思考 / 思考模式。
计费规则
扣减费用 = Token 消耗量 x 单价。优先从赠送余额扣减,再扣充值余额。
- 按实际 token 消耗精确计费
- 赠送余额优先扣除
- 价格可能调整,请定期查看本页
DeepSeek 保留修改价格的权利。请按需充值。