首次调用 API

DeepSeek API 使用与 OpenAI 兼容的 API 格式,通过修改配置,您可以使用 OpenAI SDK 来访问 DeepSeek API,或使用与 OpenAI API 兼容的软件。 PARAM VALUE base_url *        https://api.deepseek.com api_key apply for an API key * 出于与 OpenAI 兼容考虑,您也可以将 base_url 设置为 https://api.deepseek.com/v1 来使用,但注意,此处 v1 与模型版本无关。 * deepseek-chat 模型已全面升级为 DeepSeek-V3,接口不变。 通过指定 model=’deepseek-chat’ 即可调用 DeepSeek-V3。 * deepseek-reasoner 是 DeepSeek 最新推出的推理模型 DeepSeek-R1。通过指定&nbs

全文

DeepSeek爆火,英伟达股价暴跌,白宫回应

当地时间1月27日,美国股市开盘即大幅下跌,科技板块尤为惨重。市场分析认为,核心原因是中国人工智能初创公司DeepSeek的最新突破,动摇了美国科技行业的“无敌”地位。 因受到DeepSeek人工智能模型冲击,美国芯片巨头英伟达(NVIDIA)当日股价暴跌约17%,博通公司股价下跌17%,超威半导体公司(AMD)股价下跌6%,微软股价下跌2%。此外,人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌21%,Vistra的股价下跌29%。 27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。 对于DeepSeek爆火,85后创始人梁文锋回应:中国AI不可能永远跟随。 令世界震撼的DeepSeek 据悉,DeepSeek应用程序已取代竞争对手OpenAI的ChatGPT,成为美国苹果应用商店下载量最大的免费应用程序。据报道,DeepSeek开发的模型在多项测试中的表现都优于OpenAI,且设计成本不到600万美元。 “这种惊喜和第一次用ChatG

全文

DeepSeek创始人凌晨宣布,多模态Janus-Pro-7B模型发布并开源

深度求索(DeepSeek)创始人梁文锋深夜发文官宣,DeepSeek刚刚发布并开源了一款名为Janus-Pro-7B的多模态AI模型,可以生成图像。据梁文锋介绍,在 GenEval和DPG-Bench基准测试中,Janus-Pro-7B击败了OpenAI的DALL-E3和Stable Diffusion。”就在今日凌晨,DeepSeek工程师们已经在Hugging Face平台上传了Janus Pro 7B和1.5B模型。这俩模型是去年DeepSeek 10月发布的Janus模型升级版。

全文

DeepSeek登顶苹果App Store免费榜!超越ChatGPT

1月27日,苹果App Store中国区免费榜显示,DeepSeek站上首位。同时,DeepSeek在美区苹果App Store免费榜从昨日的第六位飚升至第一位,超越ChatGPT及Meta公司旗下的社交媒体平台Threads,以及Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。 界面新闻查询发现,这也是唯一一次中国应用能同期在中国和美区苹果App Store占据第一位。此前小红书和Temu也曾成为美区App Store下载冠军,但未能实现在中国也同步站上首位。 就在昨日,DeepSeek曾出现了短时闪崩现象。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。 该应用由国产大模型公司“深度求索”(隶属量化巨头幻方量化)开发,其推理大模型DeepSeek-R1凭借高性能和低成本优势,在发布后迅速引发市场关注。 DeepSeek-R1作为开源模型,在数学、代码和自然语言推理任务中表现接近OpenAI的GPT-4o,且训

全文

DeepSeek-R1 发布,性能对标 OpenAI o1 正式版

正式发布 DeepSeek-R1,并同步开源模型权重。 性能对齐 OpenAI-o1 正式版​ DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。 在此,我们将 DeepSeek-R1 训练技术全部公开,以期促进技术社区的充分交流与创新协作。 论文链接: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf 蒸馏小模型超越 OpenAI o1-mini​ 我们在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。 HuggingFace 链接: https://huggingface.co/deepseek-ai 开放的许可证和用户协议​ 为了推

全文

DeepSeek推出App版本

近期,许多用户发现,中国初创公司深度求索在苹果应用商店上架了自己的大模型应用“DeepSeek”,其下方评论中就有网友表示,用了一年的网页端,终于等到了App。 该App的商店页面显示,这是DeepSeek官方推出的AI助手,可“免费体验与全球领先AI模型的互动交流”。其使用开源的 DeepSeek-V3 大模型,多项性能指标对齐海外顶尖模型,可以用更快的速度、更加全面强大的功能答疑解惑,助力高效美好的生活。 上个月(12月26日),深度求索正式对外发布 DeepSeek-V3大模型,据其介绍,该模型在多个方面超越、追平各种开源、闭源大模型。而在DeepSeek开源社区收获的广泛好评,显示出开发者们已经用脚进行了投票。 首先是百科知识上,V3的知识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)水平相比前代 DeepSeek-V2.5 (下称V2.5)显著提升,接近当前表现最好的模型 Claude-3.5-Sonnet-1022。长文本测评方面,在DROP、FRAMES 和 LongBench v2 上,V3 平均表现超越其他模型。 此外,V3 在算法类代码场景(

全文

////