added
2024.09.09 DeepSeek 模型系列更新
23 days ago by kai chen
- 平台新增deepseek-ai/DeepSeek-V2.5模型,使用deepseek-ai/DeepSeek-V2.5
- DeepSeek-Coder-V2-Instruct 滚动更新为 deepseek-ai/DeepSeek-Coder-V2-Instruct-0724,[使用最新deepseek-ai/DeepSeek-Coder-V2-Instruct]
- 接口文档:https://docs.siliconflow.cn/reference/chat-completions-3
关于DeepSeek V2.5:
DeepSeek V2 Chat 和 DeepSeek Coder V2 两个模型已经合并升级,升级后的新模型为 DeepSeek V2.5。
新模型在通用能力、代码能力上,都显著超过了旧版本的两个模型。
新模型更好的对齐了人类的偏好,在写作任务、指令跟随等多方面进行了优化:
ArenaHard winrate从 68.3% 提升至 76.3%
AlpacaEval 2.0 LC winrate从 46.61% 提升至 50.52%
MT-Bench 分数从 8.84 提升至 9.02
AlignBench 分数从 7.88 提升至 8.04
与此同时新模型在原Coder模型的基础上进一步提升了代码生成能力,对常见编程应用场景进行了优化,并在标准测试集上取得了以下成绩:
HumanEval: 89%
LiveCodeBench (1-9月): 41%