对比数据:
指标 | DeepSeek-R1 | OpenAI-o1 | Claude-3.5 |
---|---|---|---|
AIME 2024 (Pass@1) | 79.8% | 79.2% | 16.0% |
Codeforces Percentile | 96.3% | 96.6% | 20.3% |
单Token成本 | $0.14/M | $5.00/M | $15.00/M |
长上下文支持 | 128K | 64K | 200K |
优势总结:
- 数学推理:MATH-500得分97.3%,超越所有开源模型
- 编程实战:LiveCodeBench Pass@1达65.9%,逼近人类专家水平
- 商业落地:MIT协议允许免费商用,支持私有化部署