2. 中国科学院大学 计算机科学与技术学院 北京 100049
2. School of Computer Science and Technology, University of Chinese Academy of Sciences, Beijing 100049, China
2025年1月20日,杭州深度求索人工智能基础技术研究有限公司(以下简称“DeepSeek公司”)正式发布DeepSeek-R1模型,并同步开源模型权重,引起全世界轰动及一系列连锁反应:英伟达市值单日暴跌近6 000亿美元,降幅高达17%;DeepSeek APP在全球140个国家的移动应用下载量排行榜上位居榜首,仅用7天时间便实现新增1亿用户;在全球最大开源平台Huggingface上,DeepSeek-R1在1个月内就实现下载量超过1 000万次,在全球150万模型中位列第1,成为Huggingface平台最受欢迎的开源大模型;OpenAI、百度也宣布将会开源各自大模型;各行各业、各地政府都积极开展本地部署DeepSeek······
DeepSeek大模型取得了举世瞩目的成就,引起国内各界诸多思考。例如,李国杰院士通过7个问题深入剖析了DeepSeek背后所蕴含的人工智能(AI)发展路径①,包括规模法则(Scaling Law)局限性、通用人工智能(AGI)实现道路、中国如何实现AI自立自强等。笔者认为,DeepSeek能在全球引起如此巨大轰动效应,至少有2个关键原因:①在达到全球最顶尖大模型水平下实现数量级级别的成本降低,展现了技术先进性;②通过开源模式在全球大规模快速扩散,同时打破国内“百模大战”的局面,成为国内大模型“事实标准”。本文将探讨开源模式对于推动科技发展的作用,尤其在促进产学研协同机制方面的作用。
① 李国杰. DeepSeek引发的AI发展路径思考. 科技导报, 2025, 43(3): 14-19.
1 以开源凝共识DeepSeek公司创始人梁文峰曾在一次采访中指出,创新需要能组织高密度的人才。笔者对此观点高度认可。如何能组织高密度人才,凝聚共识至关重要——思想决定行动,只有在思想上形成共识,一个组织的成员才能自发地朝着共同的目标行动。然而,不管是要让成长经历各不相同的个体形成共识,还是要让业务、管理、文化千差万别的组织机构达成共识,都是极具挑战的任务。
共识的形成,需要有各方都认同的底层逻辑来支撑。古往今来,人们都是通过探寻客观规律来获得信心乃至信念。如果存在一种揭示世界万物运行的客观规律(如牛顿三大定律),那么不同背景的人们就会相信客观规律,从而产生一种信念——只要按照客观规律办事,就会得到规律所预测的结果——这也便自然形成了共识。因此,共识的形成,需要有各方都认同的客观规律作为底层逻辑来支撑,而非仅靠灌输主观意愿所能达成。
开源是凝聚共识的一种有效方式,因为开源背后存在客观规律的支撑,包括开源符合打破知识垄断、促进知识传播的社会学规律,开源符合“交易成本” “杰文斯效应”等经济学规律,等等。这些规律揭示了开源必将会作为一种人类社会所崇尚的活动而长期存在,并会不断扩展到越来越多领域。因此通过开源,能在高密度人才中形成号召力。
1.1 开源打破知识垄断,促进知识传播众所周知,在人类文明发展历程中,知识传播发挥了决定性作用。相反,知识若被垄断则会影响人类文明的发展。以中世纪的欧洲为例,长达1 000年处于黑暗的文明停滞状态,正是因为知识被极少数人垄断。中世纪欧洲的知识传播载体是羊皮书,成本极贵,导致欧洲在中世纪书籍十分稀少。普通民众根本没有机会接触书籍,于是知识被教会和贵族牢牢垄断。到15世纪,欧洲突然出现了文艺复兴,主要原因又正是造纸术和印刷术传入欧洲,知识获取成本骤降百倍,从而对欧洲文明发展产生了革命性影响。1454 —1500年的46年间,欧洲印制的书籍超过1 200万册,超过此前1 000年制作的所有书籍数量。造纸术和印刷术打破了知识垄断,赋予了普通人获得知识的权利。
纵观人类历史,不同时代的新知识呈现出不同的形式,相应的载体也随之变迁(图 1):① 2 000多年前因为载体的稀缺,只有极少数人(如中国的诸子百家、古希腊哲学家等)提出的新思想、新理论才能被记录在书籍予以传播,代表那个时代人类的创新知识;②欧洲的文艺复兴时代,以伽利略为代表的一批科学家崇尚用新方法开展实证科学研究,得益于印刷术与造纸术,这些新方法能通过大量学术论文的形式记录、发表与传播,大大促进了欧洲科学进步;③ 18世纪第一次工业革命以来,人类开始热衷于制造各种复杂的机械装置和精密仪器,尤其是20世纪中叶进入信息时代,各种复杂软件系统呈指数级增长。信息时代以来,人类绝大多数创新知识是针对这些复杂系统的局部优化技术,这些新技术无法孤立地存在,需要集成到系统中才能展现出效果,于是开源系统便成为一种记录和传播新方法、新技术的高效形式,更有利于传播创新知识。
![]() |
图 1 知识形式与知识载体的变迁 Figure 1 Evolution of forms and carriers of knowledge |
通过以上分析可知,新思想、新理论一般通过图文(著书、论文)形式来记录和传播。但是对于新方法、新技术,如果只是用图文方式来记录,那么其他人并不容易复现,不利于创新知识的传播。因此,开源项目就是一种记录和传播“创新知识”的出色载体,如Linux开源项目的源代码包含了诸多新方法、新技术,也成为孕育“创新”的沃土。
1.2 开源契合市场规律,加速技术推广开源孕育形成于软件领域,并不断拓展到硬件芯片等领域,目前已成为数字经济不可或缺的要素。开源模式被业界广泛接受,有其经济学原理支撑。
第一个经济学原理是交易成本(transaction cost)理论。1991年诺贝尔经济学奖得主科斯发现,虽然社会分工可以提升生产效率,但同时也会引入“交易成本”。基于“交易成本”理论,若两种技术收益相近,那么企业会倾向于选择交易成本更低的技术。开源能显著降低交易成本。以DeepSeek为例,各行各业都在积极接入DeepSeek,正是因为开源省去了交易环节与交易成本。因此,一旦存在高质量的开源技术,必然会得到企业的关注和应用。
第二个经济学理论是杰文斯效应(Jevons Effect)。技术成本降低,将提升技术的普及度,从而扩大市场规模,这是英国经济学家杰文斯在第一次工业革命中发现的规律。他发现大幅提升蒸汽机的效率,每台蒸汽机的用煤量减少,但煤总需求量大幅增加,这是因为蒸汽机因使用成本降低而被广泛应用。同样地,开源模式降低成本,更有利于技术推广,促进产业发展。
综上所述,开源自身符合市场经济规律,可用市场行为来进行分析。过去中国经常被责怪是国际开源社区的“拿来主义者”,核心原因在于还未意识到开源本身也是一个市场,需要积极投入推出有竞争力的开源技术,才能赢得开源市场份额。
2 以开源促合作如何建立“产—学—研”高效协同机制是我国科技事业长期以来亟待解决的体制机制难题。建立高效协同机制,关键是要形成一条可持续运转的创新链,即“技术创新→原型验证→样品研制→产品定型→商品推广”创新链。在该创新链中,学术界的定位主要是“技术创新→原型验证”环节,而产业界的定位则是“样品研制→产品定型→商品推广”。
我国学术界与产业界之间的协同并未有效打通,往往都卡在“原型验证→样品研制”环节,开源可以有效地解决这个环节薄弱的难题。如前所述,开源系统是一种记录和传播新知识的高效形式,因此学术界可将创新技术通过开源系统进行呈现。具体可有两种呈现方式,一种是将创新技术集成到已有的开源项目中,另一种是直接发起开源项目来展现创新技术。高质量的开源项目能吸引产业界参与和投入,于是创新技术通过开源项目在产业界得到应用,并可获得产业界的反馈,从而开展进一步的深入研究。如此,一种基于开源模式的产学研高效协同机制便建立起来了。
2.1 基于开源模式的创新联合体上述机制在笔者团队参与构建开源指令集RISC-V生态的过程中得到了实践检验,并取得了积极效果。笔者团队在中国科学院战略性先导科技专项支持下,于2019年发起高性能RISC-V处理器核“香山”开源项目,吸引了全球众多顶尖科研院校基于香山开展科研和教学。目前,“香山”已成为国际开源社区性能最强、最活跃的处理器核。根据全球最大开源项目托管平台GitHub统计数据,“香山”开源项目的星标数高达6 000余分(表明社区关注度与活跃度),遥遥领先其他开源芯片项目,分支数也超过700。国内几十所高校或研究所基于“香山”开展创新,诸多成果发表在顶尖会议与期刊上。
以“香山”开源项目为底座,团队进一步构建了“科研院所+新型研发机构+企业”开源芯片创新联合体(图 2),通过开源模式联合企业开发共性技术,缩短企业二次开发周期,打通产研环节,形成一条有效运转的创新链,加速“香山”落地应用。其中,中国科学院计算技术研究所等科研院所聚焦“技术创新→原型验证”环节,新型研发机构北京开源芯片研究院(简称“开芯院”)聚焦“原型验证→样品研制”环节,众多企业则聚焦“样品研制→产品定型→商品推广”环节。这种创新联合体机制实现了创新链不同环节的分工与协作,发挥各自的优势,并相互补位。
![]() |
图 2 “科研院所+新型研发机构+企业”开源芯片创新联合体 Figure 2 Open-source chip innovation consortium "universities and institutes + new type of R&D institutions + enterprises" |
目前,该机制已开始有效运转,联合企业形成一支全球规模最大(超过500人)的RISC-V开源芯片研发团队,仅2024年企业联合开发技术研讨即超过100次,大幅加速了核心技术的研发和应用进程,相关成果量产节点预计提前2年以上。
2.2 基于开源模式的科教融合开源有助于“科技、教育、人才”三位一体的贯彻实施。基于开源模式,笔者团队于2019年启动了“一生一芯”计划,探索基于开源模式、贯通课程的实践型大规模人才培养计划。“一生一芯”计划的核心理念是“用开源技术、做开源芯片、育芯片人才”,即基于开源软硬件生态形成处理器芯片人才培养体系,探索“硅上做教学”。
“一生一芯”计划的开源模式体现在3个方面:①面向全国开放,不论地域、高校、专业和年级,皆可免费参与——线上报名后,先以线上学习为主,再择优到线下基地高强度训练;②所有学习资料开源开放,任何人都可免费获取,包括42万字讲义、1 000页幻灯片与50小时的教学视频;③学习过程采用开源芯片与开源软件技术体系,包括开源指令集RISCV、开源操作系统、开源编译器、开源电子设计自动化(EDA)工具链等。
“一生一芯”计划的开源模式产生了4个方面积极影响:①极大地降低了学生获取芯片教学资源的门槛。开展5年来,“一生一芯”计划累计报名超10 000人,覆盖800余所高校,培养处理器芯片实践型人才超1 500人(图 3)。②促进开源芯片生态的发展。“一生一芯”学员们在学习芯片设计过程中,大量使用开源EDA工具链、开源IP等开源技术并及时反馈问题,这促进了开源技术的迭代演进。③为开源领域积聚人才。许多学生通过参加“一生一芯”计划接触到开源芯片并高度认同开源理念,从而在后续的科研与工作中更愿意从事开源相关的工作。④通过开源教育推动国际合作。如今越来越多的国家出现芯片人才培养需求,中国通过开源方式可以为这些国家提供相关国际公共品,促进国际交流合作。
![]() |
图 3 一生一芯”计划学员分布 Figure 3 Distribution of "One Student One Chip" initiative participants |
DeepSeek让各界看到开源的价值与意义,通过开源实现在全球快速扩散。DeepSeek的案例展示了开源作为一种商业模式、一种生态构建方式的威力。但开源的价值与意义不只是局限于商业,它还是一种凝聚共识、促进合作的有效方式。正如孙凝晖院士表示②,开源模式蕴含着一种精神——一种共享共治的精神,一种打破垄断、开放创新的精神,一种鼓励奉献的精神;开源精神是习近平总书记提出的“构建人类命运共同体”理在信息技术领域的最好体现。
② 孙凝晖. 论开源精神. (2021-04-12)[2025-03-05]. https://weibo.com/ttarticle/p/show?id=2309404625205493629370.