DeepSeek-R1对比评测——超越Claude/GPT-4的性价比之选

对比数据

指标DeepSeek-R1OpenAI-o1Claude-3.5
AIME 2024 (Pass@1)79.8%79.2%16.0%
Codeforces Percentile96.3%96.6%20.3%
单Token成本$0.14/M$5.00/M$15.00/M
长上下文支持128K64K200K

优势总结

  • 数学推理:MATH-500得分97.3%,超越所有开源模型
  • 编程实战:LiveCodeBench Pass@1达65.9%,逼近人类专家水平
  • 商业落地:MIT协议允许免费商用,支持私有化部署

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

////