DeepSeek-LLM – 第 4 页 – 新闻、部署、资源等

官方API

首次调用 API

15 2 月, 202515 2 月, 2025

DeepSeek API 使用与 OpenAI 兼容的 API 格式，通过修改配置，您可以使用 OpenAI SDK 来访问 DeepSeek API，或使用与 OpenAI API 兼容的软件。 PARAM VALUE base_url * https://api.deepseek.com api_key apply for an API key * 出于与 OpenAI 兼容考虑，您也可以将 base_url 设置为 https://api.deepseek.com/v1 来使用，但注意，此处 v1 与模型版本无关。 * deepseek-chat 模型已全面升级为 DeepSeek-V3，接口不变。通过指定 model=’deepseek-chat’ 即可调用 DeepSeek-V3。 * deepseek-reasoner 是 DeepSeek 最新推出的推理模型 DeepSeek-R1。通过指定&nbs

全文

云部署

Azure/GitHub集成——DeepSeek-R1现可一键接入企业工作流

15 2 月, 202515 2 月, 2025

Microsoft Azure AI工坊正式集成DeepSeek-R1，企业用户可享受： python 复制 import openai client = openai.Client(api_key=”DEEPSEEK_API_KEY”) response = client.chat.completions.create( model=”deepseek-reasoner”, messages=[{“role”:”user”, “content”:”解释量子纠缠原理”}] ) 定价方案：

全文

新闻

DeepSeek-R1对比评测——超越Claude/GPT-4的性价比之选

15 2 月, 202515 2 月, 2025

对比数据：指标 DeepSeek-R1 OpenAI-o1 Claude-3.5 AIME 2024 (Pass@1) 79.8% 79.2% 16.0% Codeforces Percentile 96.3% 96.6% 20.3% 单Token成本 $0.14/M $5.00/M $15.00/M 长上下文支持 128K 64K 200K 优势总结：

全文

新闻

DeepSeek模型发布历史

15 2 月, 202515 2 月, 2025

全文

新闻

DeepSeek爆火，英伟达股价暴跌，白宫回应

28 1 月, 202516 2 月, 2025

当地时间1月27日，美国股市开盘即大幅下跌，科技板块尤为惨重。市场分析认为，核心原因是中国人工智能初创公司DeepSeek的最新突破，动摇了美国科技行业的“无敌”地位。因受到DeepSeek人工智能模型冲击，美国芯片巨头英伟达(NVIDIA)当日股价暴跌约17%，博通公司股价下跌17%，超威半导体公司(AMD)股价下跌6%，微软股价下跌2%。此外，人工智能领域的衍生品，如电力供应商也受到重创。美国联合能源公司股价下跌21%，Vistra的股价下跌29%。 27日，DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT。同日，苹果中国区应用商店免费榜显示，DeepSeek成为中国区第一。对于DeepSeek爆火，85后创始人梁文锋回应：中国AI不可能永远跟随。令世界震撼的DeepSeek 据悉，DeepSeek应用程序已取代竞争对手OpenAI的ChatGPT，成为美国苹果应用商店下载量最大的免费应用程序。据报道，DeepSeek开发的模型在多项测试中的表现都优于OpenAI，且设计成本不到600万美元。 “这种惊喜和第一次用ChatG

全文

事件

DeepSeek创始人凌晨宣布，多模态Janus-Pro-7B模型发布并开源

28 1 月, 202516 2 月, 2025

深度求索（DeepSeek）创始人梁文锋深夜发文官宣，DeepSeek刚刚发布并开源了一款名为Janus-Pro-7B的多模态AI模型，可以生成图像。据梁文锋介绍，在 GenEval和DPG-Bench基准测试中，Janus-Pro-7B击败了OpenAI的DALL-E3和Stable Diffusion。”就在今日凌晨，DeepSeek工程师们已经在Hugging Face平台上传了Janus Pro 7B和1.5B模型。这俩模型是去年DeepSeek 10月发布的Janus模型升级版。

全文

事件

DeepSeek登顶苹果App Store免费榜！超越ChatGPT

27 1 月, 202516 2 月, 2025

1月27日，苹果App Store中国区免费榜显示，DeepSeek站上首位。同时，DeepSeek在美区苹果App Store免费榜从昨日的第六位飚升至第一位，超越ChatGPT及Meta公司旗下的社交媒体平台Threads，以及Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。界面新闻查询发现，这也是唯一一次中国应用能同期在中国和美区苹果App Store占据第一位。此前小红书和Temu也曾成为美区App Store下载冠军，但未能实现在中国也同步站上首位。就在昨日，DeepSeek曾出现了短时闪崩现象。对此，DeepSeek回应称，当天下午确实出现了局部服务波动，但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后，用户访问量激增，服务器一时无法满足大量用户的并发需求。该应用由国产大模型公司“深度求索”（隶属量化巨头幻方量化）开发，其推理大模型DeepSeek-R1凭借高性能和低成本优势，在发布后迅速引发市场关注。 DeepSeek-R1作为开源模型，在数学、代码和自然语言推理任务中表现接近OpenAI的GPT-4o，且训

全文

事件官方更新

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版

20 1 月, 202516 2 月, 2025

正式发布 DeepSeek-R1，并同步开源模型权重。性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。在此，我们将 DeepSeek-R1 训练技术全部公开，以期促进技术社区的充分交流与创新协作。论文链接： https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf 蒸馏小模型超越 OpenAI o1-mini 我们在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时，通过 DeepSeek-R1 的输出，蒸馏了 6 个小模型开源给社区，其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。 HuggingFace 链接： https://huggingface.co/deepseek-ai 开放的许可证和用户协议为了推

全文

新闻

DeepSeek-R1系列模型正式发布——推理能力比肩OpenAI-o1，全开源赋能社区

20 1 月, 202515 2 月, 2025

DeepSeek-AI正式推出新一代推理大模型DeepSeek-R1系列，包含基于纯强化学习训练的DeepSeek-R1-Zero和融合冷启动数据的DeepSeek-R1。该系列模型在数学、代码和复杂推理任务中表现优异，性能与OpenAI-o1-1217持平。关键亮点包括：访问资源：

全文

事件

DeepSeek推出App版本

13 1 月, 202516 2 月, 2025

近期，许多用户发现，中国初创公司深度求索在苹果应用商店上架了自己的大模型应用“DeepSeek”，其下方评论中就有网友表示，用了一年的网页端，终于等到了App。该App的商店页面显示，这是DeepSeek官方推出的AI助手，可“免费体验与全球领先AI模型的互动交流”。其使用开源的 DeepSeek-V3 大模型，多项性能指标对齐海外顶尖模型，可以用更快的速度、更加全面强大的功能答疑解惑，助力高效美好的生活。上个月（12月26日），深度求索正式对外发布 DeepSeek-V3大模型，据其介绍，该模型在多个方面超越、追平各种开源、闭源大模型。而在DeepSeek开源社区收获的广泛好评，显示出开发者们已经用脚进行了投票。首先是百科知识上，V3的知识类任务（MMLU, MMLU-Pro, GPQA, SimpleQA）水平相比前代 DeepSeek-V2.5 （下称V2.5）显著提升，接近当前表现最好的模型 Claude-3.5-Sonnet-1022。长文本测评方面，在DROP、FRAMES 和 LongBench v2 上，V3 平均表现超越其他模型。此外，V3 在算法类代码场景（

全文

« 上一页 1 2 3 4 5 下一页 »