跳转到内容

DeepSeek-R1

维基百科,自由的百科全书
DeepSeek R1
开发者深度求索
首次发布2025年1月20日,​10个月前​(2025-01-20
当前版本
  • 1.0.0(2025年4月9日;稳定版本)[1]
编辑维基数据链接
源代码库 编辑维基数据链接
前任DeepSeek-R1-Lite
继任DeepSeek-V3.1
类型
许可协议MIT
网站www.deepseek.com

DeepSeek-R1深度求索(DeepSeek)于2025年1月20日发布的人工智能大型语言模型,专门适用于数学、编码和逻辑等任务,性能对标OpenAI o1[2]

训练

[编辑]

DeepSeek-R1-Lite是Deepseek R1的预览版,于2024年11月20日发布。[3]后于2025年1月20日正式发布发布DeepSeek R1[4]

DeepSeek-R1与DeepSeek-R1-Zero[5]基于DeepSeek-V3-Base,与其共享了相同的架构。而DeepSeek-R1-Distill系列模型则由其他预训练的开放权重模型(包括LLaMAQwen)初始化,然后基于R1生成的合成数据进行微调。[6]

DeepSeek-R1-Zero的训练模板
A conversation between User and Assistant. The User asks a question and the Assistant solves it. The Assistant first thinks about the reasoning process in the mind and then provides the User with the answer. The reasoning process and answer are enclosed within <think>...</think> and <answer>...</answer> tags, respectively, that is, <think> reasoning process here </think><answer> answer here </answer>. User: prompt[注 1]. Assistant:

DeepSeek-R1-Zero仅使用GRPO强化学习进行训练,未使用SFT。与之前的版本不同,它没有使用基于模型的奖励。所有奖励函数均基于规则。主主要分为两种类型(其他类型未具体说明):准确率奖励和格式奖励。准确率奖励用于检查方框内的答案是否正确(针对数学问题)或代码是否通过测试(针对编程问题)。格式奖励用于检查模型是否将其思维轨迹置于<think>...</think>标签内。[6]

DeepSeek-R1的论文中没有公布其训练成本等细节。[8]

不过此前的论文中,深度求索透露其训练使用的是英伟达因为美国出口管制而针对中国市场特供的低配版GPU H800,训练成本为557.6万美元,远低于类似西方公司的闭源模型。[2][9][10]

外界预估R1的训练成本DeepSeek-V3略高,或在600万美元上下。[11]

特点

[编辑]

DeepSeek称该模型用了强化学习训练,并为用户展现了 o1 没有公开的完整思考过程。

Deepseek R1 Lite在回答问题前会花更多时间思考,因此准确度会增强。Deepseek的测试结果表明,在数学竞赛上的得分与测验所允许思考的长度紧密相关,而模型思维炼长度增加展现了更高的效率。[3]

DeepSeek-R1关键特点就是便宜,与OpenAI o1的价格相差极大。DeepSeek-R1上线时提供的API服务定价为每百万输入tokens 1元人民币(缓存命中)/4元(缓存未命中),每百万输出tokens 16元,输出API价格仅仅只有OpenAI o1的3%。[12]

测试成绩

[编辑]

Deepseek-R1-Lite在数学、代码和复杂逻辑推理上,获得媲美 o1-preview 的推理效果。

美国数学邀请赛中,DeepSeek 称,该模型在美国邀请数学考试和 MATH 等既定基准上的表现超过了 OpenAI o1 Preview的水平,在国际数学奥林匹克正确率达到83%,

它还在Codeforces编程竞赛中优于89%的参赛者,但在GPQA Diamond,LiveCodeBench和自然语言解谜中较为逊色。[13]

应用情况

[编辑]

DeepSeek-R1使用MIT协议开源,意味着任何人都可以自由使用该模型,包括商业用途。

用户可以在DeepSeek官方网站和App使用官方提供的服务。

公共服务

[编辑]

中国

[编辑]

2025年2月起,中国多地政府部门相继将DeepSeek接入政务服务系统,用于公文写作、政策解读等方面[14]

2025年2月8日,广东省深圳市龙岗区政务服务和数据管理局就已经在政务外网部署了DeepSeek-R1模型。

2025年2月16日,深圳市正式为全市各区及各部门提供DeepSeek模型应用服务[15];其中,福田区基于DeepSeek开发了首批70名AI“数智员工”[16][17][18]

2025年2月17日,佛山市“江义村智慧乡村平台”于正式接入DeepSeek[19]

2025年2月18日,北京市丰台区在政务云本地部署DeepSeek大模型[14]

香港

[编辑]

香港生成式人工智能研发中心在DeepSeek的基础上,开发HKGAI V1人工智能大语言开源基础模型[20]

HKGAI V1支援粤语、普通话及英语,将DeepSeek本地化、使用香港本地数据[21],全参数微调,并持续训练。

HKGAI V1涵盖“港话通”、“港文通”、“港会通”、“港法通”、“港环通”等系统[22][23],当中的“港文通”为生成式人工智能文书辅助应用程序,在超过70个香港政府部门开始试用[24][25]

创新科技及工业局局长孙东表示,期望“港话通”手机版应用程序在2025年内推出[26],并以此提供更有个性化的服务[27]

2025年5月8日,廉政公署向公众展出“深博士”(英语:Dr. Deep),廉署在DeepSeek的基础上开发的人工智能模型[28],可提供廉署资讯及防贪建议[29],未来有机会在廉署的分区办事处、网上或手机使用[30]

其他

[编辑]

沈阳飞机设计研究所在研发新战机的过程中,引入了DeepSeek[31]

多家汽车制造商,包括BMW[32]东风汽车比亚迪广汽零跑[33]本田[34]日产[35],宣布与DeepSeek合作,将其AI系统和中国版汽车结合。

2025年缅甸地震的救援行动中,中国国家紧急语言服务团与北京语言大学团队基于DeepSeek的大模型,研发中缅英互译系统,支援中国国际救援队进行救灾工作[36][37][38],并在未来开源与其他地区使用。

外界反应

[编辑]

1月27日,DeepSeek超越ChatGPT,登顶苹果App Store美国区免费APP下载排行榜。[39]

DeepSeek-R1爆火,引发全球投资者大量抛售人工智能相关股票。1月27日,英伟达美股股价下跌近17%,单日市值蒸发5890亿美元,为美国股市历史上最大。[40][41]

DeepSeek-R1发布后不久,Meta首席执行官马克·扎克伯格就宣布,Meta计划在2025年投入超600亿美元,加大对人工智能的投入。[11]据媒体1月27日报道,Meta成立了四个研究小组,专门研究DeepSeek的模型。[42]其中两个小组研究其开发者如何降低训练和运行DeepSeek的成本,第三个小组研究训练模型可能使用了哪些数据,第四个小组研究基于DeepSeek模型属性重构其LLaMA模型的新技术。[43]

OpenAI表示,其有证据表明DeepSeek使用OpenAI的专有模型来训练自己的开源模型,这违反了OpenAI的服务条款。[44]在R1的Nature论文释出的同行评议文件中,DeepSeek-R1的研究人员称,R1 并没有使用OpenAI专有模型生成的样本但同时承认与大多数的生成模型一样,在训练过程中不可避免地使用了互联网上的由其他AI生成样本[45]

现状与替代方案

[编辑]

由于用户量激增,DeepSeek R1曾面临服务器频繁繁忙问题,主要归因可能有多种,包括算力需求、带宽限制及网络攻击。用户可通过本地部署(如Ollama工具)、调用API或使用第三方平台。

参见

[编辑]

注释

[编辑]
  1. ^ prompt在训练过程中会被具体的推理问题所替换。

参考资料

[编辑]
  1. ^ Release 1.0.0. 2025年4月9日 [2025年6月27日]. 
  2. ^ 2.0 2.1 DeepSeek横空出世,美中AI竞争会迎来根本性改变吗?. 美国之音. 2025-01-28 [2025-01-28]. (原始内容存档于2025-01-28) (中文). 
  3. ^ 3.0 3.1 DeepSeek推理模型预览版上线,解密o1推理过程 | DeepSeek API Docs. api-docs.deepseek.com. [2025-01-29]. (原始内容存档于2025-01-26) (中文(中国大陆)). 
  4. ^ DeepSeek-R1 发布,性能对标 OpenAI o1 正式版. DeepSeek API Docs. 2025-08-21 [2025-09-19] (中文). 
  5. ^ Release DeepSeek-R1 · deepseek-ai/DeepSeek-R1@23807ce. GitHub. [21 January 2025]. (原始内容存档于21 January 2025) (英语). 
  6. ^ 6.0 6.1 DeepSeek-AI; Guo, Daya; Yang, Dejian; Zhang, Haowei; Song, Junxiao; Zhang, Ruoyu; Xu, Runxin; Zhu, Qihao; Ma, Shirong, DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning, 22 January 2025, arXiv:2501.12948可免费查阅 
  7. ^ Guo, Daya; Yang, Dejian; Zhang, Haowei; Song, Junxiao; Wang, Peiyi. DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning. Nature (Springer Science and Business Media LLC). 2025-09-17, 645 (8081): 633–638. ISSN 0028-0836. doi:10.1038/s41586-025-09422-z可免费查阅. 
  8. ^ DeepSeek-R1/DeepSeek_R1.pdf at main · deepseek-ai/DeepSeek-R1 (PDF). [2025-02-01]. (原始内容存档 (PDF)于2025-01-29). 
  9. ^ DeepSeek-V3/DeepSeek_V3.pdf at main · deepseek-ai/DeepSeek-V3 (PDF). [2025-02-01]. (原始内容存档 (PDF)于2025-02-01). 
  10. ^ 孙铭蔚. 量化巨头幻方创始人梁文锋参加总理座谈会并发言,他还创办了“AI界拼多多”. 澎湃新闻. 2025-01-22 [2025-01-28]. (原始内容存档于2025-01-26) (中文(中国大陆)). 
  11. ^ 11.0 11.1 吴遇利. DeepSeek“恐惧感”支配硅谷!Meta被曝组建4个小组专门研究. 澎湃新闻. 2025-01-27 [2025-01-29]. (原始内容存档于2025-01-30) (中文(中国大陆)). 
  12. ^ 郑远方. “价格屠夫”DeepSeek的理想主义:开源、降本与AI普惠. 财联社. 2025-01-28 [2025-01-28] (中文(中国大陆)). 
  13. ^ Franzen, Carl. DeepSeek’s first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance. VentureBeat. 2024-11-20 [2025-01-29]. (原始内容存档于2024-11-22) (美国英语). 
  14. ^ 14.0 14.1 多地政务系统接入DeepSeek意味着什么?. 新华网. [2025-02-20]. (原始内容存档于2025-02-18). 
  15. ^ 广州、深圳政务系统接入DeepSeek. 新浪新闻. [2025-02-20]. (原始内容存档于2025-02-25). 
  16. ^ 深圳70名“AI公务员”上岗,公文处理、招商引资等场景均有覆盖. 澎湃新闻. 
  17. ^ 首批“AI公务员”上岗!人类“饭碗”不保?. 新浪财经. [2025-02-20]. (原始内容存档于2025-02-21). 
  18. ^ Oscar. 深圳福田引入 70 個 AI 公務員 基於 DeepSeek R1、錯誤率5% 內. 香港 unwire.hk 玩生活.乐科技. 2025-02-17 [2025-05-15]. (原始内容存档于2025-03-20) (中文(香港)). 
  19. ^ 中国新闻网. 佛山“江义村智慧乡村平台”接入DeepSeek. 腾讯网. [2025-02-20]. (原始内容存档于2025-02-22). 
  20. ^ 科大率先試用首個港產AI大模型HKGAI V1 推動教育創新 | The Hong Kong University of Science and Technology. hkust.edu.hk. [2025-05-15]. (原始内容存档于2025-05-16). 
  21. ^ (有片)香港首個AI模型HKGAI V1誕生 實現DeepSeek系統本地化. 香港文汇网. [2025-05-15]. (原始内容存档于2025-03-23) (zh-Hans-HK). 
  22. ^ DeepSeek本地化 香港首個AI大模型HKGAI V1 誕生 冀年內開放使用 | 智慧生活 | 中國科技. 当代中国. [2025-05-15]. 
  23. ^ 香港生成式人工智能研發中心 於香港國際創科展2025展示多項人工智能科研新成果 | The Hong Kong University of Science and Technology. hkust.edu.hk. [2025-05-15]. 
  24. ^ 創新科技及工業局局長出席香港生成式人工智能研發中心HKGAI V1大模型全球首發發布會致辭全文(只有中文)(附圖). www.info.gov.hk. [2025-05-15]. (原始内容存档于2025-03-18). 
  25. ^ 立法會七題:香港研發的大語言模型. www.info.gov.hk. [2025-05-15]. (原始内容存档于2025-05-16). 
  26. ^ 文维广. 孫東:手機版「港話通」盡快推出 財赤下更有針對性投資創科. 香港01. 2025-03-10 [2025-05-15] (中文(香港)). 
  27. ^ 「港話通」:助力智慧城市建設與社會進步 文:劉建誠. 坚料网. 2019-05-28 [2025-05-15] (中文(香港)). 
  28. ^ 香港特別行政區廉政公署 - 新聞公佈 - 廉署展覽廳全新亮相 沉浸體驗肅貪經典 智能展現倡廉新知. www.icac.org.hk. [2025-05-15]. (原始内容存档于2025-07-23) (中文(香港)). 
  29. ^ 廉署展覽廳今開放 DeepSeek互動講故事 反貪AI「深博士」登場 葛柏數簿任睇. 大公文汇网. [2025-05-15] (zh-Hans-HK). 
  30. ^ 任葆颖. 廉署胡英明專訪|基於DeepSeek設AI系統 可供市民問有否貪污問題. 香港01. 2025-03-28 [2025-05-15]. (原始内容存档于2025-03-29) (中文(香港)). 
  31. ^ Lawton. 中國引入 DeepSeek 開發新戰機 AI 協助決策系統革新. 香港 unwire.hk 玩生活.乐科技. 2025-05-06 [2025-05-15]. (原始内容存档于2025-06-13) (中文(香港)). 
  32. ^ Lawton. BMW 在中國車款接入 DeepSeek 推動車輛智能化升級. 香港 unwire.hk 玩生活.乐科技. 2025-04-24 [2025-05-15]. (原始内容存档于2025-05-15) (中文(香港)). 
  33. ^ Oscar. DeepSeek 席捲中國汽車市場 東風、比亞迪、上汽紛紛加入 AI. 香港 unwire.hk 玩生活.乐科技. 2025-03-24 [2025-05-15]. (原始内容存档于2025-04-22) (中文(香港)). 
  34. ^ Lawton. Honda 中國車款接入 DeepSeek 並與 Momenta、寧德時代等中國廠商合作. 香港 unwire.hk 玩生活.乐科技. 2025-04-24 [2025-05-15]. (原始内容存档于2025-07-22) (中文(香港)). 
  35. ^ arthur. 日產 N7 搭載 DeepSeek AI 技術 反攻中國市場. 香港 unwire.hk 玩生活.乐科技. 2025-02-13 [2025-05-15]. (原始内容存档于2025-03-20) (中文(香港)). 
  36. ^ Oscar. DeepSeek 應用緬甸地震救災 7 小時開發中英緬互譯系統. 香港 unwire.hk 玩生活.乐科技. 2025-04-02 [2025-05-15]. (原始内容存档于2025-04-23) (中文(香港)). 
  37. ^ DeepSeek、衛星+AI、半機械昆蟲 人工智能助力緬甸地震救災. 香港文汇网. [2025-05-15]. (原始内容存档于2025-07-25) (zh-Hans-HK). 
  38. ^ 緬甸地震︱DeepSeek協助救災 7小時開發中緬英互譯系統. 星岛头条. 2025-04-02 [2025-05-15]. (原始内容存档于2025-04-04) (中文(香港)). 
  39. ^ 李潇潇, 胡含嫣. DeepSeek超越ChatGPT,登顶苹果美国区免费APP下载排行榜. 澎湃新闻. 2025-01-27 [2025-01-29]. (原始内容存档于2025-01-27). 
  40. ^ 日本放送协会. ナスダック大幅下落 中国企業ディープシーク 生成AI開発受け. NHKニュース. 2025-01-28 [2025-01-28]. (原始内容存档于2025-01-30) (日语). 
  41. ^ 何浩. 英伟达市值蒸发近6000亿美元,规模创美股史上最大,市值跌至全球第三. 华尔街见闻. 2025-01-28 [2025-01-28]. (原始内容存档于2025-01-28) (中文(中国大陆)). 
  42. ^ Meta Scrambles After Chinese AI Equals Its Own, Upending Silicon Valley. The Information. 2024-01-27 [2025-01-29]. (原始内容存档于2025-01-30) (英语). 
  43. ^ DeepSeek震撼硅谷 Meta组建四个研究小组专门破解. 财联社. 2025-01-27 [2025-01-29]. 
  44. ^ OpenAI称有证据表明DeepSeek利用其模型训练竞争对手. RFI - 法国国际广播电台. 2025-01-29 [2025-01-29] (中文(简体)). 
  45. ^ Gibney, Elizabeth. Secrets of DeepSeek AI model revealed in landmark paper. Nature. 2025-09-17 [2025-09-18]. ISSN 1476-4687. doi:10.1038/d41586-025-03015-6 (英语). 

外部链接

[编辑]

官方网页

[编辑]

媒体专题

[编辑]