
新闻
查看更多...模型能力提升一览 推理任务表现提高 新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了...查看更多...性能对齐 OpenAI-o1 正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性...查看更多...模型通用能力提升 DeepSeek-V2.5-1210 版本通过 Post-Training 阶段的迭代,全面提升了模型在各个领域的能力: 遵循我们一贯的开源精神,新版模型权重已经开源在...查看更多...全面提升的推理性能 DeepSeek-R1-Lite 预览版模型在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权威评测中,均取得了卓越的成绩...查看更多...升级历史 DeepSeek 一直专注于模型的改进和优化。在 6 月份,我们对 DeepSeek-V2-Chat 进行了重大升级,用 Coder V2 的 Base 模型替换原有的 Chat ...查看更多...在大模型 API 的使用场景中,用户的输入有相当比例是重复的。举例说,用户的 prompt 往往有一些重复引用的部分;再举例说,多轮对话中,每一轮都要将前几轮的内容重复输入。 为此...查看更多...一、更新接口 /chat/completions 1. JSON Output,增强内容格式化 DeepSeek API 新增 JSON Output 功能,兼容 OpenAI API,...深度求索
DeepSeek 微信公众号
DeepSeek APP

© 2025 DeepSeek-Ai
声明:这并非是杭州深度求索人工智能基础技术研究有限公司的官方网站,官方网站是 www.deepseek.com
由 NETP888 更新
Last Update on 2025/4/12
DeepSeek| 深度求索
基于自研训练框架、自建智算集群和万卡算力等资源,DeepSeek(深度求索)团队仅用半年时间便已发布并开源多个百亿级参数大模型,如DeepSeek-LLM通用大语言模型、DeepSeek-Coder代码大模型,并且在2024年1月率先开源国内首个MoE大模型(DeepSeek-MoE),各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。
https://user-assets.sxlcdn.com/images/1128251/FgYa5SW-OzxiDgNINBhpns3YsZO-.png?imageMogr2/strip/auto-orient/thumbnail/1200x630>/format/png