正式发布 DeepSeek-R1,并同步开源模型权重。 性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。 在此,我们将 DeepSeek-R1 训练技术全部公开,以期促进技术社区的充分交流与创新协作。 论文链接: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf 蒸馏小模型超越 OpenAI o1-mini 我们在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。 HuggingFace 链接: https://huggingface.co/deepseek-ai 开放的许可证和用户协议 为了推
你在这里
- 主页
- 官方更新
分类: 官方更新
DeepSeek API 升级,支持续写、FIM、Function Calling、JSON Output
DeepSeek API 迎来更新,装备了新的接口功能,来释放模型的更多潜力: 所有新功能,均可使用 deepseek-chat 和 deepseek-coder 模型调用。 一、更新接口 /chat/completions 1. JSON Output,增强内容格式化 DeepSeek API 新增 JSON Output 功能,兼容 OpenAI API,能够强制模型输出 JSON 格式的字符串。 在进行数据处理等任务时,该功能可以让模型按预定格式返回 JSON,方便后续对模型输出内容进行解析,提高程序流程的自动化能力。 要使用 JSON Output 功能,需要: 以下为一个 JSON Output 功能的使用样例。在这个样例中,用户给出一段文本,模型对文本中的问题&答案进行格式化输出。 详细使用方法,请参考 JSON Output 指南。 2. Function,连接物理世界 DeepSeek API 新增 Function Calling 功能,兼容 OpenAI API,通过调用外部工具,来增强模型与