全球开源生态发展现状、趋势与对策建议
郭雪     
中国信息通信研究院 北京 100191
摘要:开源作为一种开放共享的新型生产模式,已成为数字经济创新、开放、共享和可持续发展的核心驱动力。文章从技术创新、产业发展、经济贡献和社会可持续发展4个维度,探讨开源的重要价值。当前,全球开源生态呈现稳中向好的发展态势,开源项目数量和贡献者规模持续增长,中国开源在新兴技术领域逐渐发力。展望未来,开源项目将遵循技术螺旋发展规律,建立全球软硬件事实标准,推动行业开源模式应用,并在风险治理方面迈出坚实步伐。文章最后给出开源生态发展建议:通过丰富开源运营模式,强化国际合作,推动开源的社会应用,持续繁荣开源生态。
关键词开源    创新    数字经济    
CSTR: 32128.14.CASbulletin.20250225003
Current status, trends, and policy recommendations for global open source ecosystem development
GUO Xue     
China Academy of Information and Communications Technology, Beijing 100191, China
Abstract: Open source, as an innovative production model characterized by openness and sharing, has become a core driving force for innovation, openness, sharing, and sustainable development in the digital economy. This study explores the significant value of open source from four dimensions: technological innovation, industrial development, economic contribution, and social sustainability. The current global open source ecosystem is showing a positive development trend, with a continuous increase in the number of open source projects and the scale of contributors. In China, open source efforts are gradually gaining momentum in emerging technology fields. Looking ahead, open source projects are expected to follow the spiral law of technological development, establish de facto global standards for both software and hardware, promote the application of open source models across industries, and take solid steps in risk governance. Finally, this study provides recommendations for the development of the open source ecosystem, including enriching open source operation models, strengthening international cooperation, and promoting the social application of open source to sustain the prosperity of the open source ecosystem.
Keywords: open source    innovation    digital economy    

开源是一种开放共享的新型生产模式,是数字经济创新、开放、共享、可持续发展的源头活水。全球开源生态是一个由开发者、贡献者、项目、社区、企业、教育机构及政策制定者等多方参与者构成的动态系统,旨在通过开放源代码和协作开发来推动软件创新与技术进步。

1 开源的概念范围及重要价值 1.1 开源起源于软件,发展形成数字公共产品多种形态

开源孕育形成于软件领域,发展壮大于数字经济,是促进全球技术创新、产业协作和资源重组,加快发展新质生产力的重要路径。

开源作用于不同场景衍生出多种概念形态。广为人知的开源软件与闭源软件相对,其概念由开放源代码促进会(OSI)重新定义并推广,强调软件的源代码开放。2020年,联合国秘书长古特雷斯以开源软件为核心,以公益价值为出发点,在美国经济学家Shane Greenstein的基础上,提出了目前广为接受的数字公共产品概念:“尊重隐私和遵守其他适用的国际和国内法律、标准和最佳做法且无害的开源软件、开放数据、开放人工智能(AI)模型、开放标准和开放内容。”

开源具有开放性、公共性、协作性3个特征。开放性,项目自身内容(代码、数据等)开放,可以公开访问获取;项目使用方式开放,可以公开复制、修改和分发;面向受众开放,任何人都具有相应获取、使用权利。公共性,开源参与方享有自己贡献部分的著作权,即一个开源成果是属于所有参与方的共同作品;同时,开源天然具备非竞争性特征,即一部分人对开源项目的消费不会影响其他人,满足公共产品基本特征。协作性,全球贡献者共同建设并维护开源项目,形成协作关系,使得知识和技术能够高效流通和快速积累。

1.2 开源降低创新准入门槛,激发技术创新发展活力

从科技视角看,开源激发各主体活力,加速科技创新。开源汇聚众智、促进多方协同,有效实现了优势互补,激发技术创新活力。开源开放的创新模式相比于工业时代封闭专利的创新模式,更顺应数字时代技术迭代快、应用范围广的发展规律,能解决单一主体创新成本过高问题;通过去中心化的异步协作激发各类主体的创新创造活力,以开放协作实现智慧累积,对创新效率和创新质量带来巨大提升。DeepSeek-R1版本开源不到1个月,在AI开源平台HuggingFace的下载量达到422万次,从而极大加速了全球AI进程。

1.3 开源促进多元协作模式,构建产业发展新格局

从产业视角看,开源促进多元协作,助力建设开放的产业新格局。科技创新开放共享的模式引领产业协作模式开放化。传统产业吸收开放、共享、协同的协作模式,促进了产业分工体系更紧密更高效,分工链条更长更广,满足复杂技术成果易组装、垂直化的生产要求,以及场景化、定制化的应用需要。数字时代产业体系相比于工业时代以专利为牵引的封闭产业体系,具有分工效率更高、协作范围更广的特点,能够建设多元合作的产业平台,顺应分布式分工趋势,促进产业内资源共享,构建产业发展新格局。根据GitHub报告,开源已经汇聚超过1亿开发者协作。2024年3月,开放机器人基金会宣布成立开源机器人联盟(OSRA),该联盟旨在推动机器人操作系统(ROS)等开源机器人项目的开发和维护,以确保项目的长期稳定性和健康性。

1.4 开源提升数字经济活力,促进经济实力发展

从经济视角看,开源软件已渗透至经济社会各领域,对数字经济的贡献潜力巨大。根据欧盟委员会发布的《开源软硬件对欧盟经济的技术独立性、竞争力和创新的影响研究报告》(The impact of Open Source Software and Hardware on technological independence, competitiveness and innovation in the EU economy),2018年欧盟在开源软件领域投资了大约10亿欧元,开源软件带来的经济影响力为650亿—950亿欧元,且每增加10%的投入就将产生0.4%—0.6%的收益。同时,结合相关文献调研,开源软件对国内生产总值(GDP)将产生直接影响和间接影响。直接影响方面,开源软件通过吸引全球贡献者共同参与,提升软件产品在全球范围内的影响力,进一步提升软件产品净出口额,对GDP产生直接正向影响。间接影响方面,①开源软件通过协作与培训等多种方式提供了广泛的就业机会,提升信息技术(IT)行业内从业者的知识技能,增加IT领域就业人口数量,对劳动生产率因素产生促进作用,进一步对GDP产生间接正向影响。②开源软件有效促进软件持续快速迭代与技术升级,提升知识产权转化能力,扩充专利与商标规模,增加知识产权相关费用收入,进而对GDP产生间接正向影响。③开源软件源代码作为初创企业的重要技术信息来源,能够降低软件市场的准入壁垒,改善市场竞争环境,进而影响初创企业数量变化。

1.5 开源助推可持续发展目标,形成多边合作格局

从社会视角看,开源释放增量合作空间,解决社会化难题,推动全球可持续发展。开源依托网络实现“万物互联”,建立共同参与、共同享有、共同管理、共同维护的合作模式,推动实现全球共同维护的发展路径,共同解决社会化冲突问题,促进生态保护和疫情防控等工作开展,从而实现2030年联合国可持续发展目标。欧洲开放科学云(EOSC)平台已为全球170余万科研人员和7 000余万科技从业者提供开源数据,广泛用于全球减贫、公共卫生、海洋科学等领域研究。开源形成的全球分工格局相较于工业时代具有连接范围广、公共问题解决能力强的特点,能够汇聚全球资源、跨越数字鸿沟,构筑共商共建共享的全球数字治理体系,打造数字命运共同体。谷歌公司的开源软件Open Health Stack已成功协助肯尼亚孕产妇健康应用程序“Mama’s Hub”、世界卫生组织(WHO)紧急医疗项目“Em Care”等数字健康产品的开发、建设工作,有效加速第三世界国家的数字健康服务普及。

2 全球开源生态发展现状

全球开源生态稳中向好,持续突破圈层并实现边界渗透,表现为以开源项目群为核心的项目方面开源生态,以及以区域开源政策、开源人才为支撑的区域方面开源生态。

2.1 项目规模稳健发展,各梯队成熟度差异显著

全球开源软件项目数量稳定增长,总规模突破5亿个。全球最大的代码托管平台GitHub的数据显示,2024年GitHub托管仓库已达5.18亿个,新增仓库9 800万个,增长率达25%。其中,贡献质量的提高是促进开源软件项目数量规模化发展的主要原因。开源软件项目的贡献质量直接影响开源软件项目的接受度,进而影响开源软件项目的活跃度和长期稳定发展。开源软件项目的贡献接受度逐渐提升,驱动开源软件项目逐步规模化发展。

AI等前沿技术全面融合开源工具和平台,变革开源开发过程。2021年,GitHub使用OpenAI Codex模型制造出大规模生成AI开发工具GitHub Copilot。发布近2年来,GitHub Copilot通过自动完成注释和代码,已经成功帮助开源开发者完成46% 的代码编写,同时帮助开源开发者将编码速度提高了55%。2023年,随着OpenAI公司推出GPT-4模型,GitHub推出了Copilot X计划,将ChatGPT-4引入IDE(集成开发环境),使得开发者在整个开发流程中获得更多全新体验,如语音生成代码、自动发现bug(漏洞)、自动解释输入代码、自动完善Pull Request(拉取请求)等变革性开发功能。

开源软件项目“马太效应”进一步凸显,头部开源软件项目具备“断层式”领先优势。中国信息通信研究院以项目可持续性和项目可信性的中间值为坐标轴,构建并划分了包括孵化型、成长型、挑战型、领导型4个类型的开源软件项目竞争力魔力象限。GitHub平台上活跃度靠前的开源软件项目依据开源软件项目竞争力评价模型的度量结果显示,大多头部开源软件项目位列领导者和成长者地位,处于领导者地位的开源软件项目在可信性和可持续性方面均无明显短板,处于全面发展态势;处于成长者地位的开源软件项目在可信性方面较强,项目质量较高。

全球开源基金会精细化运营发挥积极作用,孵化出众多“全能型”开源项目,形成了成熟完备的运营模式。 Kubernetes(K8s)作为云原生计算基金会(CNCF)开源基金会孵化出的顶级开源项目,目前在全球容器编排市场的份额已超过90%,构建形成了44个国家8 000多家企业的协作关系。

2.2 区域分布强弱分明,中国聚焦新兴技术领域

美欧国家仍是开源主导力量,引领开源生态高速增长。美国无论是开源软件项目数量占比还是开源贡献者人数都始终位列全球第1位;欧盟和英国开源软件项目和开源贡献者占比也较高。美国开源项目全球占比超40%,是开源软件项目主要供应大国。根据中国信息通信研究院统计分析,截至2023年,在全球活跃度排名前100的开源软件项目中,美国开源软件项目占比45%,牢据第1位;中国开源软件项目占比17%,排名第2位;欧盟开源软件项目占比15%,位列第3位;其后分别是加拿大(5%)、英国(4%),巴西(3%)和印度(3%)并列第6位。

美国发展开源的目的逐步从降低开发成本上升到助力社会发展。2016年8月,美国政府发布《联邦源代码政策》(Federal Source Code Policy),要求联邦机构每年必须将不少于20%的新开发源代码以开源形式公开发布,并且要求开源至少3年。2022年9月,美国参议院国土安全和政府事务委员会通过一项新法案;该法案明确提出开源软件是数字基础设施的一部分,联邦政府应在确保开源软件长期安全上发挥支持作用。

欧盟关注开源的潜力,强调开源的收益。2022年初,欧盟委员会宣布正在采纳有关开源软件的新规则;该规则指出,只要对民众、公司或其他社会公共服务有潜在益处,就可以公开访问其软件解决方案。

中国开源项目在新兴技术领域呈后发优势,各省市积极推动开源体系政策文件。深圳、重庆、武汉、南京等地发布开源政策文件,体系化建设开源生态,给予专项咨询支持开源企业、开源人才。中国开源项目建设成果显著,积极融入全球开源主流,在新技术领域话语权多,传统技术呈追赶趋势。2023年Gitee平台开源项目已达3 000万个,新增500万个,增长率为20%。中国前端开源项目占全球一半;AI、云计算等新技术开源项目占全球开源项目的20%;操作系统项目占全球开源不到10%。中国新一代操作系统、数据库等领域开源项目不断涌现,OpenHarmony、openEuler等开源项目应用持续拓展,已形成共创生态。2023年,openEuler技术路径已经占据中国市场36.8% 的市场份额,已汇聚26家核心捐赠人,2万名开发者进行操作系统协同攻关。

全球新兴经济体国家纷纷投入开源生态建设。据GitHub统计显示,2024年开源贡献者增速排名前3位的国家是菲律宾(29%)、印度(28%)和巴西(27%)。可以看出,当前开源贡献者增速较高的国家集中在全球新兴经济体国家。印度开源贡献者增长迅猛,GitHub预测2028年其将超过美国成为全球开源贡献者最多的国家。据GitHub统计显示,2024年,印度开发者超过1 700万名,相较2023年增长率为28%;预计至2028年,印度将超过美国成为开源开发者最多的国家。这其中得益于印度在2020年推出了鼓励编程相关的国家教育政策。巴西积极建立相关法律,要求政府部门优先使用开源软件。巴西联邦政府将推广开源软件的应用作为推进电子政务、促进本国信息产业发展的一项基本政策。目前,巴西有1 300余个政府机构、1 900余家企业,以及巴西中央银行和全国4 800余家支行使用基于开放源码的操作系统。

3 全球开源生态发展趋势

开源为全球数字经济高速发展注入无限活力,为新一代信息技术的迭代升级和融合发展注入强大动力,对新时代促进经济发展、科技创新、文化繁荣、社会治理、开放合作、共同富裕具有重要意义。总体来说,开源生态呈现4个方面的发展趋势。

(1)开源项目的繁荣发展将遵循技术螺旋发展的本质脉络。全球软硬件开源经历了操作系统、云计算、大数据、AI从底层软件到上层应用,再到硬件和行业开源的历程,遵循了技术螺旋发展,从技术到产业的普遍发展规律。

(2)开源建立全球软硬件发展事实标准,影响全球技术发展路径。开源项目能在各技术领域成为事实标准,关键在于其源代码和开发过程的公开透明性。这一特性使得项目能迅速进入市场,吸引海量个人、企业的关注、参与及改进,从而构建坚实的生态壁垒。操作系统领域,Linux占据全球99%的超级计算机市场和82%的智能手机市场;云计算领域,云原生技术栈中开源占比超过60%,Kubernetes采用率接近96%;AI领域,TensorFlow占据60%以上的AI框架市场,GPT-2、Llama开源模型下载量超5亿次;硬件领域,开源指令集RISC-V成熟知识产权(IP)已覆盖从低端控制到高性能计算等领域,2024年累计出货量预计达到624亿颗。

(3)行业开源将从开源软件应用到开源模式应用。行业将充分运用开源在产业链、数据、硬件等方面进行开放协作,推动各行业数字化转型。随着各行业数字化转型程度不断加深,对于开源的理解不断深入,逐步将开源的协作模式应用于各行业间协作;通过开放共享的方式打破层层嵌套的供应模式,从树状连接变为网状连接,创造更广阔合作空间,提升生产效能。

(4)全球开源风险进入集中暴露期,开源治理体系发展迈出坚实步伐。全球开源应用过程中,开源安全、合规及供应链等风险集中暴露,对行业稳定发展构成严重威胁。既往开源治理侧重局部探索,在摸清治理规则之后,在新一轮的开源治理落地过程中将侧重企业级统筹战略规划。企业级开源治理落地涉及部门较多,需梳理的资产庞大,很难一蹴而就;同时,在考虑安全合规要求及平台建设的同时,需全生命周期考虑开源应用的持续性。随着开源治理的落地,开源风险会短期显现,随着治理程度的持续开展,开源风险将趋于常态化显现。

4 全球开源生态发展建议

(1)丰富开源运营模式,满足各类型开源项目发展需求。开源基金会,统筹关键领域开源项目发展,形成全球开发者合力,引导形成事实标准构建技术发展底座。开源技术联盟,充分支持具有发展潜力尚未具有规模效应的开源项目,以支撑大量开源项目的精细化运营需求。开源行业组织,充分发挥已有协会行业影响力,重点运营具有行业属性的开源项目。相关企业,设立开源办公室,推动内部开源项目遴选及预孵化。

(2)强化国际合作,建立开源组织间的互动机制。开源组织积极互动,探索全球开源联合体形态,形成开源项目联合孵化机制。开源项目建立更加透明和公正的治理机制,确保开源项目的决策过程公开、公平;推动不同国家和地区的开发者参与开源项目,减少对单一地区开发者的依赖,增强开源社区的多元化和包容性。依托各国开源组织及赛事活动形成全球影响力。

(3)推动开源技术的社会应用,助力解决全球性问题。努力推动开源技术在社会各领域的应用,实现技术普惠和可持续发展。通过在教育、医疗、环境保护等领域采用开源软件和平台,降低使用和开发成本,提升服务普及性和效率,加速解决方案的开发和实施,从而助力解决全球性问题,推动社会的整体进步。