DeepSeek-V3 正式发布

全新系列模型 DeepSeek-V3 首个版本上线并同步开源。 登录官网 chat.deepseek.com 即可与最新版 V3 模型对话。API 服务已同步更新,接口配置无需改动。当前版本的 DeepSeek-V3 暂不支持多模态输入输出。 性能对齐海外领军闭源模型​ DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T token 上进行了预训练。 论文链接:https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。 生成速度提升至 3 倍​ 通过算法和工程上的创新,DeepSeek-V3 的生成吐字速度从 20 TPS 大幅提高至 60 TPS,相比 V2.5 模型实现了 3 倍的提升,为用户带来更加迅速流畅的使用体验。 API 服

全文

DeepSeek API 升级,支持续写、FIM、Function Calling、JSON Output

DeepSeek API 迎来更新,装备了新的接口功能,来释放模型的更多潜力: 所有新功能,均可使用 deepseek-chat 和 deepseek-coder 模型调用。 一、更新接口 /chat/completions​ 1. JSON Output,增强内容格式化​ DeepSeek API 新增 JSON Output 功能,兼容 OpenAI API,能够强制模型输出 JSON 格式的字符串。 在进行数据处理等任务时,该功能可以让模型按预定格式返回 JSON,方便后续对模型输出内容进行解析,提高程序流程的自动化能力。 要使用 JSON Output 功能,需要: 以下为一个 JSON Output 功能的使用样例。在这个样例中,用户给出一段文本,模型对文本中的问题&答案进行格式化输出。 详细使用方法,请参考 JSON Output 指南。 2. Function,连接物理世界​ DeepSeek API 新增 Function Calling 功能,兼容 OpenAI API,通过调用外部工具,来增强模型与

全文

////