官方更新 – DeepSeek-LLM

正式发布 DeepSeek-R1，并同步开源模型权重。性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。在此，我们将 DeepSeek-R1 训练技术全部公开，以期促进技术社区的充分交流与创新协作。论文链接： https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf 蒸馏小模型超越 OpenAI o1-mini 我们在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时，通过 DeepSeek-R1 的输出，蒸馏了 6 个小模型开源给社区，其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。 HuggingFace 链接： https://huggingface.co/deepseek-ai 开放的许可证和用户协议为了推

全文

DeepSeek API 迎来更新，装备了新的接口功能，来释放模型的更多潜力：所有新功能，均可使用 deepseek-chat 和 deepseek-coder 模型调用。一、更新接口 /chat/completions 1. JSON Output，增强内容格式化 DeepSeek API 新增 JSON Output 功能，兼容 OpenAI API，能够强制模型输出 JSON 格式的字符串。在进行数据处理等任务时，该功能可以让模型按预定格式返回 JSON，方便后续对模型输出内容进行解析，提高程序流程的自动化能力。要使用 JSON Output 功能，需要：以下为一个 JSON Output 功能的使用样例。在这个样例中，用户给出一段文本，模型对文本中的问题&答案进行格式化输出。详细使用方法，请参考 JSON Output 指南。 2. Function，连接物理世界 DeepSeek API 新增 Function Calling 功能，兼容 OpenAI API，通过调用外部工具，来增强模型与

全文

分类：官方更新

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版

DeepSeek API 升级，支持续写、FIM、Function Calling、JSON Output

分类

最近文章