2. 中国科学院大学 前沿交叉科学学院 北京 101408
2. School of Advanced Interdisciplinary Sciences, University of Chinese Academy of Sciences, Beijing 101408, China
近年来,人工智能技术正以前所未有的速度发展,技术模式的选择对行业发展具有深远影响。大模型(如GPT系列、BERT、Llama、DeepSeek等)成为推动人工智能技术应用创新的关键力量。而大模型通常分为开源与闭源大模型两种技术模式,其在不同的条件和环境下各具优势。本文将重点阐述开源与闭源的差异性,并探讨两种技术模式对人工智能生态系统发展的重要影响。
1 开源与闭源之争:谈古论今开源指开放源代码,允许用户修改、使用、分发;而闭源指代码封闭,用户不能修改和查看。开源与闭源的竞争贯穿了计算机和软件技术发展的整个历史,每一次技术的变革都伴随着两者激烈的较量。开源与闭源不仅是技术理念的碰撞,更关乎商业模式、创新速度和市场主导权的争夺。
1.1 软件技术的开源与闭源:1.0阶段在计算机的早期阶段,开源占据优势。随着计算机产业化的发展,企业开始意识到软件本身的商业价值,闭源开始逐渐占据优势。20世纪80年代,操作系统成为开源与闭源竞争的焦点。美国微软公司的Windows以闭源的形式迅速占领了个人计算机市场,与此同时,理查德·斯托曼等试图建立开源的Linux操作系统对抗微软的闭源操作系统,其在服务器市场表现出极强的生命力。
20世纪90年代,互联网的兴起让软件生态发生了重大变化。美国微软公司的Internet Explorer(IE)浏览器凭借与Windows操作系统的深度绑定,迅速击败了网景(Netscape Navigator)浏览器;而网景在失败后选择将其代码开源,成为对抗IE的重要力量。2008年,美国Google公司推出了基于开源Chromium引擎的Chrome浏览器,展现了强大的市场竞争力,使得微软在2019年被迫采用开源的Chromium引擎,即在开源的潮流中选择了改变。
由开源与闭源的竞争历史可以看出二者并非绝对对立,而是不断演变的动态关系。微软曾经反对代码开源,如今却成为全球最大的开源社区GitHub的拥有者,并开源了.NET框架;Google公司和Meta公司在人工智能领域利用开源推动技术发展,但仍在核心产品上保持一定的封闭性。开源与闭源各具优势:开源的创新能力和社区协作精神可以推动技术的进步,而闭源的商业模式则提供了较好的资金和资源支持。
1.2 大模型技术的开源与闭源:2.0阶段开源与闭源的竞争从1.0阶段的操作系统和应用软件延伸到了当前的大模型,本文称之为2.0阶段。相比于1.0阶段开源软件的完全公开,2.0阶段的大模型技术模式早期阶段多采取闭源的模式,如美国OpenAI公司的ChatGPT聊天机器人和百度的文心一言人工智能助手等。随着大模型技术的发展和演进,越来越多的团队采取开源模式。
在开源大模型中,又分为完全开源和部分开源等。例如:①完全开源(代码+训练数据+预训练权重开源),如Stable Diffusion(CompVis许可证)、BERT(Apache 2.0许可证);②部分开源(代码+权重开源,数据闭源),如Llama 2和3(Meta许可证)、Mistral 7B(Apache 2.0许可证)。DeepSeek是开源大模型中的典型代表,其最初为部分开源,后来逐渐放开剩余代码。目前,DeepSeek已在全球引起了广泛影响和关注,如2025年1月30日的Nature文章认为“DeepSeek以其独特的架构和出色的性能震惊了世界”①。
① Conroy G, Mallapaty S. How China created AI model DeepSeek and shocked the world. Nature. 2025, 638: 300-301.
2 开源模式的技术扩散机制与产业赋能效应当前,全球科技飞速发展,开源模式不仅成为推动技术创新与生态构建的重要引擎,也催生了全新的商业模式;与此同时,其也面临数据安全、隐私风险、商业化困境和伦理监管等多重挑战。
2.1 开放协作重构技术研发范式开源模式打破了地域、机构和技术壁垒,使全球开发者、研究者及企业能够共同参与前沿技术的研发与优化。例如,Meta公司的Llama系列大模型和DeepSeek系列大模型的开源实践,使得从初创团队到国际知名高校的研究者均能基于相同的基础模型开展垂直领域创新,涵盖法律文书、医学诊断、蛋白质结构预测等专业场景②。这种跨界合作不仅加速了技术进步,也为不同领域带来了创新灵感。2025年1月29日Nature刊发的文章认为“优秀的开源模型会吸引越来越多的顶尖人才”③。开源大模型因其源代码、参数及训练过程的透明性,使得社区能迅速发现并修复漏洞。正如Linux基金会报告中提到,开源模型的漏洞平均修复时间远低于闭源系统。此外,透明研发有助于独立机构进行安全性和准确性审计,增强模型公信力。
② Dessimoz C, Thomas P D. AI and the democratization of knowledge. Science Data, 2024, 11(1): 268.
③ Elizabeth Gibney. Scientists flock to DeepSeek: how they’re using the blockbuster AI model. Nature, 2025, doi: 10.1038/d41586-025-00275-0.
2.2 创新模式的“三层金字塔”结构“三层金字塔”结构:①基础层——服务支持与生态构建。类似RedHat模式,即通过对开源模型提供企业级服务和支持来实现盈利。例如,智能绘图工具Stability AI借助Stable Diffusion文生图模型,向企业客户提供SLA服务等级保障,其年营收突破上亿美元。开源框架和完善的文档支持,构建起强大的技术基石,使企业能够稳定地采用和部署模型。②中间层——模型迭代与平台支持。开源模型推动了模型共享平台的形成。例如:被广泛使用的模型Hugging Face Transformer在开源社区Github平台上已经获得了超过42 000个收藏,每月被安装超100万次,有800人为Hugging Face Transformers贡献了代码,有效弥补了科学与生产之间的鸿沟。③应用层——生态绑定与增值服务。开源策略不仅能够增强产品自身的竞争力,而且能够带动周边生态系统的发展。例如,阿里云将开源学习框架FederatedScope与云服务深度整合,使人工智能计算效率大幅提升;华为公司的MindSpore框架开源后,更推动了昇腾芯片出货量的激增。这种生态效应形成了从基础服务到应用增值的闭环商业模式④。
④ 张进. 智谱AI狂飙:与商业化博弈的一年. (2024-03-15) [2025-03-06]. https://www.leiphone.com/category/ai/bSeMqNVS0Bs739pJ.html.
2.3 技术民主化与开放生态构建开源推动知识共享与技术民主化,开创了“微调即服务”等新业态,降低技术门槛,让各国和各层次用户均能共享最新的算法与工具。正如Meta公司首席人工智能科学家Yann LeCun所言,开放大模型使技术民主化提前数年,其为小型企业和初创者提供了利用70 B参数模型开发创新工具的机会⑤。开放标准和协议的采用防止了技术锁定,增强了不同系统之间的互联互通,不仅降低了开发成本,还促进了跨平台应用,为大模型在各个行业的广泛部署提供了灵活性和适应性,DeepSeek大模型即是其中的受益者。2025年1月23日Nature刊发的文章指出,“DeepSeek这一廉价的开源模型为小型企业和高校提供了更加广阔的空间和创新的可能性,为更加开放民主的科研生态作出重大贡献”⑥。
⑤ 孔海丽, 赵云帆. DeepSeek改变AI未来——最应该关注的十大走向. (2025-02-07)[2025-03-06]. https://www.21jingji.com/ar-ticle/20250207/94c5360926bb5bfac3c3d6053f8ea93e.html.
⑥ Gibney E. China's cheap, open AI model DeepSeek thrills scientists. Nature, 2025, 638: 13-14.
2.4 开源大模型面临的风险与挑战开源模式在带来技术民主化与产业赋能的同时,也面临着数据安全、伦理风险和商业盈利等多重挑战。①数据安全与伦理风险。开源模式由于训练数据和模型参数的公开,可能会被恶意用户利用,从中提取敏感信息或滥用于生成虚假信息,可能对社会与公共安全产生不利影响。此外,模型生成的内容有时会反映出训练数据中的偏见,如性别、文化、地域或政治偏见,这不仅会影响用户体验,更可能引发伦理风险。②商业化与盈利模式困境。虽然开源模式极大降低了研发成本,但同时也可能使商业价值稀释。企业如何在免费共享代码的同时实现盈利,成为一个重大挑战。部分公司通过提供增值服务、企业级支持和专有功能来弥补这一缺口,但如何平衡开放性与商业利益,仍需不断探索。③技术对齐与安全漏洞。开源模式在追求开放透明的同时,也需要解决对齐问题,即确保模型行为与人类期望一致。当前,许多大模型存在“幻觉”现象和不可预测的行为,这可能在高风险场景中带来严重后果。此外,开源代码容易被攻击者检视和利用,如何确保模型在开放环境下的鲁棒性和安全性,是亟待解决的问题。
3 闭源模式的技术壁垒构建与企业级协同闭源模式通过控制核心技术、数据和软硬件体系,构建技术壁垒,实现从研发到商业落地的全链条优势与企业级协同,保障企业和机构的商业利益。然而,这种模式同时也存在着技术垄断和创新受限等风险。
3.1 数据飞轮效应优势闭源模式拥有海量与高质量的数据积累优势,允许企业对数据来源、标注标准和反馈机制进行全流程控制,不断优化模型性能,形成数据飞轮效应优势。例如,OpenAI公司的GPT-4模型训练数据池已突破13万亿词元(Tokens)的规模,涵盖了专业期刊、专利文献等高质量语料,使得GPT-4模型在专业应用中具备了较强的竞争力⑦。
⑦ GPT-4“终极大揭秘”:1.8万亿巨量参数、训练一次6300万美元. (2023-07-11)[2025-03-06]. https://wallstreetcn.com/articles/3692958.
3.2 软硬协同的效能突破闭源模式通过在硬件、软件和数据层面实现紧密协同,可在同样的资源下获得更高的性能和更低的能耗,不仅降低了运行成本,还为企业级应用提供了稳定高效的解决方案。例如,谷歌公司依托自研TPU v5芯片构建了完整的闭源训练体系,实现了硬件级的效率优化,Gemini Ultra模型在同等参数下的训练能耗比开源方案降低38%,TPU芯片集群流水线优化方案使大规模并行训练任务延迟大幅降低⑧。
⑧ 2024年12月15日的Neurips大会,谷歌首席科学家Jeff Dean《关于系统机器学习以及Google如何看待这些事情》完整演讲. (2024-12-19)[2025-03-06]. https://www.pdsub.com/subtitle/2145007299.
3.3 定制化服务的可靠保障闭源模式能够实现严格的版本控制和安全检测,企业可根据自身需求对闭源模型进行专门微调和功能扩展,从而获得完全符合业务场景的定制化产品,同时表现出较好的稳定性和安全性。例如,微软公司与OpenAI公司的深度合作使得GPT-4模型的应用程序编程接口(API)能够稳定集成到各类企业应用中,通过对核心技术和数据的保密,OpenAI公司不仅在ChatGPT应用上吸引了数亿用户,还通过云服务、API接口等方式实现了商业推广,获得较好的市场认可。
3.4 闭源模式面临的风险与挑战闭源模式虽具备上述优势,但与此同时,也存在技术垄断、透明性不足等风险。如何在确保商业利益与技术创新的同时,实现适度开放、增强透明度,并平衡各方利益,是亟待探索并解决的关键问题。①技术垄断与封闭风险。闭源模式固然能保护企业商业利益,但也容易形成技术垄断,限制市场公平竞争。由于核心技术和数据不对外开放,学术界和中小企业难以参与,这可能导致整个行业技术发展受限,并增加对单一供应商的依赖风险。②透明性与信任危机。由于内部机制高度封闭,闭源大模型往往缺乏外部专家和开发者的参与,限制了集体智慧的碰撞和多元化创新。缺少内部细节认知,使得外界难以评估闭源模型的真实性能和潜在风险。例如,GPT-4的详细架构和训练数据未公开,令研究人员对其内部机制及可能存在的偏见、安全漏洞产生疑虑。③持续创新的动力不足。研究结果表明,选择闭源模式的企业,技术壁垒一旦形成,其创新动力和技术迭代速度通常会呈现减缓的趋势,行业整体的技术进步速度也会受之影响。这个阶段,往往会激发开源社区的反弹热情,对闭源厂商造成压力,迫使其不得不开源部分技术,以获得市场认可。
4 前沿争议与破局思考 4.1 开源与闭源大模型的困境从数据版权角度来看,美国斯坦福大学人工智能研究所(HAI)2024年研究报告显示,90%的开源模型存在“数据套娃”现象,这极有可能引发严重的版权争议⑨。法学专家劳东燕教授警告,如果不对数据来源进行溯源审计,整个人工智能产业将面临系统性法律风险⑩。这反映出在尊重开源文化的背景下,开源模型的数据使用缺乏规范和约束,没有充分考虑到数据产权的归属和保护,违背了开源文化中对知识和数据合理使用的原则。
⑨ AI Index. [2025-03-08]. https://aiindex.stanford.edu/wp-content/uploads/2024/04/HAI_AI-Index-Report-2024_Chapter3.pdf.
⑩ 2024年度十大著作权事例|黄玉烨教授点评“AI大模型训练版权问题引发全球关注”. (2023-05-15)[2025-03-08]. https://www.sohu.com/a/852510832_221481.
在模型评估方面,现有的主流基准测试存在严重偏颇。以2024年发布的MMLU-Pro基准测试数据集为例,其存在系统性偏袒闭源模型的现象,不同模型使用的提示词差异显著,答案提取规则也不一致,开源模型仅仅因格式偏差就会随机扣分⑪。这导致开源模型的真实性能难以得到公正的评估。
⑪ 大模型权威测试被曝翻车:更偏袒GPT-4等闭源模型,连提示词都区别对待. (2024-07-12)[2025-03-08]. https://www.thepaper.cn/newsDetail_forward_28035024.
当前,人工智能领域正处于技术革新与产业变革的关键时期,开源与闭源大模型在推动技术创新和构建生态系统方面各有优势。需要理性、客观对待企业和机构的开源与闭源模式选择,大模型“热”发展的同时也需要“冷”思考,是采取“快一步”的策略还是“慢半拍”的战略,不能一概而论。
4.2 破局之道(1)尊重开闭源文化并推动科技民主化。在解决数据版权争议问题方面,DeepMind公司提出的“数据护照”机制值得关注。该机制通过区块链记录训练数据产权,在模型推理时自动分配收益。这一机制不仅尊重了开源文化中数据共享的精神,也充分考虑到了数据提供者的权益,通过技术手段确保数据的来源可追溯、产权可界定,为开源模型的数据使用提供了一种可行的解决方案,使开源文化在合理的框架内得以发展。当前,许多高校、科研院所与企业正在改进现有的测试标准或方法,其目的是使测试对于开源模型和闭源模型更公平。这体现了科技民主化的要求,通过建立公平的评估体系,让开源和闭源模型在同一起跑线上竞争,能够充分发挥各自的优势,促进人工智能技术的整体进步。只有在公平的环境下,才能让更多的创新力量参与到人工智能的发展中来,实现科技的广泛共享和共同进步。
(2)有为政府与有效市场的协同作用。针对开源与闭源两种技术模式的不同特点,政府、高校、科研机构与企业需探寻协同破局之道。政府可以通过制定合理的激励政策和监管框架,尊重技术创新和市场基本规律,开拓创新空间的同时兜住风险底线,破解“一管就死、一放就乱”的困局,引导人工智能技术的健康发展。大模型等人工智能新技术和新应用,往往具有一定的复杂性和不可预见性,是典型的复杂系统,要运用复杂性科学和系统观念的“涌现”思想合理应对。科技政策制定的过程中,要尽量遵循“有所为、有所不为”的原则,营造适当宽松的创新生态环境,保持一定的定力、耐心和信心,缓解科研人员和机构的焦虑和压力,建立合理的创新容错机制,真正激活科研创新者的主动性、积极性和内驱力。通过建立科学的筛选机制,发现有潜力的创新性技术或团队,并制定合理的技术转化或推广机制,调动高校、科研院所和企业等积极性,根据国家和市场需求以及创新者的自身利益,系统调整发展策略,实现政府和市场资源的有效配置⑫。通过尊重创新机构自身选择的开源与闭源模式、践行科技民主化和发挥有为政府与有效市场的协同作用,平衡技术创新、商业利益与社会责任,有望找到解决开源与闭源大模型争议的破局之道,推动人工智能技术与产业的健康可持续发展。
⑫ Domen V, Bogdan Š, Jernej V. Is open source the future of AI? A data-driven approach. Applied Science, 2025, 15(5): 2790.