推理模型 (deepseek-reasoner)

deepseek-reasoner 是 DeepSeek 推出的推理模型。在输出最终回答之前,模型会先输出一段思维链内容,以提升最终答案的准确性。我们的 API 向用户开放 deepseek-reasoner 思维链的内容,以供用户查看、展示、蒸馏使用。 在使用 deepseek-reasoner 时,请先升级 OpenAI SDK 以支持新参数。 API 参数​ 上下文拼接​ 在每一轮对话过程中,模型会输出思维链内容(reasoning_content)和最终回答(content)。在下一轮对话中,之前轮输出的思维链内容不会被拼接到上下文中,如下图所示: 请注意,如果您在输入的 messages 序列中,传入了reasoning_content,API 会返回 400 错误。因此,请删除 API 响应中的 reasoning_content 字段,再发起 API 请求,方法如访问样例所示。 访问样例​ 下面的代码以 Python 语言为例,展示了如何访问思维链和最终回答,以及如何在多轮对话中进行

全文

FIM 补全(Beta)

FIM(Fill-In-the-Middle)补全 API。 用户需要设置 base_url=”https://api.deepseek.com/beta” 来使用此功能。 Request​ BODY REQUIRED Responses​ OK SCHEMA REQUESTCOLLAPSE ALLBase URL https://api.deepseek.com/betaAuthBearer TokenBody REQUIRED { “model”: “deepseek-chat”, “prompt”: “Once upon a time, “, “echo”: false, “frequency_penalty”: 0, “logprobs”: 0, “max_tokens”: 1024, “presence_penalty”: 0, “stop”: null, “stream”: false, “stream_options”: null, “suffix”: null, “temperature”: 1, “top_p”: 1 }

全文

对话补全

POSThttps://api.deepseek.com/chat/completions 根据输入的上下文,来让模型补全对话内容。 Request​ BODY REQUIRED Responses​ OK, 返回一个 chat completion 对象。 SCHEMA REQUESTCOLLAPSE ALLBase URL https://api.deepseek.comAuthBearer TokenBody REQUIRED { “messages”: [ { “content”: “You are a helpful assistant”, “role”: “system” }, { “content”: “Hi”, “role”: “user” } ], “model”: “deepseek-chat”, “frequency_penalty”: 0, “max_tokens”: 2048, “presence_penalty”: 0, “response_format”: { “type”: “text” }, “stop”: null, “

全文

错误码

您在调用 DeepSeek API 时,可能会遇到以下错误。这里列出了相关错误的原因及其解决方法。 错误码 描述 400 – 格式错误 原因:请求体格式错误解决方法:请根据错误信息提示修改请求体 401 – 认证失败 原因:API key 错误,认证失败解决方法:请检查您的 API key 是否正确,如没有 API key,请先 创建 API key 402 – 余额不足 原因:账号余额不足解决方法:请确认账户余额,并前往 充值 页面进行充值 422 – 参数错误 原因:请求体参数错误解决方法:请根据错误信息提示修改相关参数 429 – 请求速率达到上限 原因:请求速率(TPM 或 RPM)达到上限解决方法:请合理规划您的请求速率。 500 – 服务器故障 原因:服务器内部故障解决方法:请等待后重试。若问题一直存在,请联系我们解决 503 – 服务器繁忙 原因:服务器负载过高解决方法:请稍后重试您的请求

全文

限速

DeepSeek API 不限制用户并发量,我们会尽力保证您所有请求的服务质量。 但请注意,当我们的服务器承受高流量压力时,您的请求发出后,可能需要等待一段时间才能获取服务器的响应。在这段时间里,您的 HTTP 请求会保持连接,并持续收到如下格式的返回内容: 这些内容不影响 OpenAI SDK 对响应的 JSON body 的解析。如果您在自己解析 HTTP 响应,请注意处理这些空行或注释。 如果 30 分钟后,请求仍未完成,服务器将关闭连接。

全文

Token 用量计算

token 是模型用来表示自然语言文本的基本单位,也是我们的计费单元,可以直观的理解为“字”或“词”;通常 1 个中文词语、1 个英文单词、1 个数字或 1 个符号计为 1 个 token。 一般情况下模型中 token 和字数的换算比例大致如下: 但因为不同模型的分词不同,所以换算比例也存在差异,每一次实际处理 token 数量以模型返回为准,您可以从返回结果的 usage 中查看。 离线计算 Tokens 用量​ 您可以通过如下压缩包中的代码来运行 tokenizer,以离线计算一段文本的 Token 用量。 deepseek_v3_tokenizer.zip

全文

////