中国超算产业发展现状分析
历军     
曙光信息产业股份有限公司 北京 100193
摘要:超级计算历来是衡量一个国家科技水平和创新能力的重要标志,也是促进社会经济可持续发展、产业转型升级和提高人民生活水平的重要手段之一。在国家政策大力支持下,近10年来的中国超算产业迎来了飞速发展的阶段,在某种程度上达到了国际先进水平。文章回顾近10年来国内外超算产业的发展现状,解读我国超算行业所面临的机遇与挑战。在分析了未来超算产业发展的技术趋势后,从政策、产业和技术等角度为中国超算产业在E级计算时代的爆发提供了产业政策的相关参考建议。
关键词超级计算    高性能计算    现状分析    E级计算    规划建议    
Review on Current Chinese Supercomputing Industry
LI Jun     
Sugon Information Industry Co. Ltd., Beijing 100193, China
Author: LI Jun  Ph. D.candidate of Beijing Jiaotong University, President of Dawning Information Industry Co. Ltd., Senior Engineer. Director of National High Performance Computing Engineering Technology Research Center, Vice Chairman of China Electronic Standardization Association, Director of High Performance Computing Standards Committee of China Electronics Standards Association, Chairman of Advanced Computing Technology Innovation and Industrialization Alliance of Chinese Academy of Sciences. He has presided over and participated the research of Sugon 1000 to Sugon 6000, six generations of Sugon supercomputer research. His main research areas include:high performance computing technology, industrial economics, etc. E-mail:lijun@sugon.com
Abstract: Supercomputing has always been a symbolic indicator of a country's science and technology and its innovate ability. It is also one of the important tools to promote sustainable socio-economic development, industrial transformation and upgrading, and improve people's living standards. With strong national supports, China's supercomputing industry in the past decade has ushered in a stage of rapid development, and reached the global advanced level in certain aspects. This paper reports the observation on the development of China's supercomputing industry in the past decade, and interprets the opportunities and challenges faced by China's supercomputing industry. After analyzing the technological trends of future supercomputing industry development, we provide consulting suggestions for industrial policies towards the coming Exascale computing era.
Keywords: supercomputing     high performance computing     industry analysis     Exascale     strategic planning advice    

“超级计算”,一个高深的名词,随着最近10年来中国超算行业逐渐进入国际领先地位而被频繁提起,并逐渐走入大众视野。在行业内外,不同的声音也随之出现,如超算行业巨大的投入与中国社会经济发展所处的阶段并不匹配,以及中国超算行业只会堆积硬件等问题。因此,客观地评价中国超算行业对于国家科技发展、经济转型升级和提升公共民生福利的地位和重要作用,将对中国超算行业的决策和后续发展提供坚实的政策基础和实践参考。

1 超级计算机的战略意义

高性能计算,又称超级计算,是计算机科学重要的前沿性分支,从电子计算机诞生之日起,计算能力的提升就是信息产业从业人员追求的核心目标之一。它不仅是一个国家综合科研水平的重要标志,也是综合支撑国家安全、经济和社会发展等可持续发展的不可替代的信息技术手段。

1.1 推动国家科技创新能力的跨越式发展

我国《“十三五”国家科技创新规划》(国发〔 2016〕 43号)明确提出“发展先进计算技术,重点加强E级(百亿亿次级)计算、云计算、量子计算、人本计算、异构计算、智能计算、机器学习等技术研发及应用”。

高性能计算已经成为解决国家发展面临的重大挑战性问题和科技创新的必备工具,如能源短缺、环境污染、全球气候变化等可持续发展的困难;支持传统产业转型升级,如大飞机、高速列车及汽车的设计在各个阶段均需要高性能计算支撑,有助于提高产品性能、缩短研发周期、降低设计成本;在生命科学方面,新药研究、精准医疗正在改变着人们的医疗模式;计算材料学已经成为发现新功能材料,提高材料性能的重要手段。

1.2 以超算平台为支撑的先进计算技术推动各学科交叉融合和发展

习近平总书记在2018年5月28日的两院院士大会上指出,“以信息化、智能化为杠杆培育新动能。要突出先导性和支柱性,优先培育和大力发展一批战略性新兴产业集群,构建产业体系新支柱。要推进互联网、大数据、人工智能同实体经济深度融合”。

当前,计算科学领域则正在从第三范式(传统的计算模拟与数字仿真)走向第四范式(基于大数据相关性分析的科学发现和研究),高度依赖于高性能计算与科学大数据、深度学习之间的深度融合。近年来,人工智能的突破正是建立在超级计算机计算能力突飞猛进的发展和深度学习算法的成功结合。发展以超级计算机为支撑平台的先进计算系统,将进一步推动高性能计算、智能计算和大数据的深度融合与创新发展。

1.3 推动完善战略性国家基础信息基础设施的建设

信息和计算能力已经被视作现代社会的重要战略资源,以承载超级计算能力和海量信息的超算中心为代表的大型信息化基础设施也日益呈现出其作为建设创新型国家的战略性基础设施的重要性。超算中心具有鲜明的公共性、动态性、自治性和开放性等基础设施平台的特征,因此超算中心是一个资源汇聚、技术创新和人员交流的支撑平台,可以提升区域科研水平,增强企业的核心竞争力,进而推动地方经济建设。

1.4 广泛服务于国家公共民生行业,提升社会的可持续发展和幸福指数

科学研究、能源行业、气候气象、生物医药和工业制造等国家重要的公共民生行业都是超算行业传统的应用领域。例如,随着数值天气预报技术的快速发展,大幅提高了预报的准确率和时效性,对于农业、水利、海洋开发、航空、交通和环境保护等各相关行业提供了重要的社会公共产品,极大地增加了整个社会的福利。

2 国际超算行业的发展现状

自从上一个10年,国际超级计算能力达到P级计算(1 PFlops,千万亿次计算,每秒钟可执行1015次双精度浮点计算)之后,各国已经开始瞄准下一个性能目标——E级计算(1 EFlops,百亿亿次计算,每秒钟可执行1018次双精度浮点计算)(表 1)。

表 1 世界主要大国E级高性能计算机研制计划

美国长期以来对超算产业的大力支持,使得美国在系统研制、计算应用、超算服务及其人员结构等方面保持了国际领先的地位。为最大化推动超算产业为经济竞争力和科学发现带来的效益,2015年美国奥巴马政府以“国家战略计算推进计划”(NSCI)总统行政命令的方式,完全由政府方面主导,旨在规划出一个长期的、多机构参与的战略远景,制定联邦政府投资战略,并与工业界及学术界协同执行。

欧盟也十分重视发展超级计算基础设施,重点侧重于软件、应用和算法的研究。为此,欧盟曾规划了若干个发展计划。例如,德国的E级创新中心(EIC)计划;西班牙巴塞罗那超级计算中心启动了E级“ EU Mont-Blanc计划”;法国BULL公司的“ SEQUANA”计划等。欧盟2013年启动“ Horizon 2020”(地平线2020)计划,其中的探索基金项目“面向百亿亿次的高性能计算”将在2014—2020年投入7亿欧元开展研究。

日本文部省2014年6月宣布启动E级计划,名为“ post-K”,用于国家高性能计算基础设施(HPCI)。初步预计的投资额为13亿美元,2021年完成研制。日本强调以社会问题为导向,发展科学计算对解决社会问题的贡献,以及科学计算与研究领域融合实现新的科学发现,将针对药物发现与医疗保健、一般灾害预防、能源环境问题和社会经济预测等4个重点领域。

俄罗斯近几年也加强了超级计算机的研发,其联邦原子能署于2011年9月批准了《2012—2020年百亿亿次超级计算机为基础的高性能计算技术构想》,拨款450亿卢布,计划到2020年达到百亿亿次运算能力。

3 中国超算业的发展现状 3.1 中国超级计算机发展现状

近10年来,在国家“ 863”等多个国家科技计划的持续支持下,我国在超级计算领域取得了长足发展。从技术上看,以“天河”“神威”“曙光”等为代表的超级计算机的性能在TOP500排行榜中长期处于世界领先位置,一共获得过11次TOP500榜单的第一名,占全部次数的55%。

http://www.top500.org/.

中国超级计算机制造厂商重要的里程碑式的事件有:2004年和2008年,曙光公司分别研制成功“曙光4000”十万亿次计算机与“曙光5000”百万亿次计算机分别进入TOP500排名前十位;2009年,国防科技大学研制成功“天河一号”千万亿次计算机,使我国成为继美国之后世界上第二个研制成功千万亿次计算机的国家;2010年6月,曙光公司研制成功“星云”千万亿次计算机,性能列世界TOP500第二位;2010年11月,升级后的“天河-1A”系统创造了超级计算机全球排名第一的最好成绩;2010年底,“神威·蓝光”成为第一个全部采用国产CPU实现的千万亿次超级计算机;2013年6月开始,“天河二号”连续6次位居TOP500第一名;2016年底第一次由全国产CPU的“神威·太湖之光”取代第一的位置。

习近平总书记在2018年5月28日的两院院士大会上指出,“我们着力推进面向国家重大需求的战略高技术研究,超级计算机连续10次蝉联世界之冠,采用国产芯片的‘神威·太湖之光’获得高性能计算应用最高奖‘戈登·贝尔’奖”。

可喜的是,中国超算产业不但进入技术领先的前列,而且在市场占有率上也在一步一个脚印地扎实提高。TOP500榜单上,来自中国超算的制造厂商已经从4年前的7.4%的份额,逐渐增长为接近50%,在市场份额上也逐渐和美国并驾齐驱(表 2)。在国内市场,“曙光”系列高性能计算机已经连续9年在中国TOP100排行榜中占据最大市场份额,国产平台的市场份额在2013年也首次超越了国外平台;2018年国产平台更是占据了全部榜单,最低性能全部超过1PLOPS的计算能力。

http://www.hpc100.cn/.

表 2 TOP500列表中来自中国厂商制造的超级计算机的份额

曙光公司的产业化经验表明,中国超算产业可持续性发展的关键在于:核心技术向产品转化过程中,一定要以市场为导向,以企业为主体,产学研用相结合。中国超算产业需要把已经突破的关键技术下移到中、小规模系统,这不但可以扩大中国超算市场的参与度和衍生产品的收益,而且能够辐射到更广泛的应用领域,从而形成高性能-价格比、具备很强市场竞争力的通用批量产品。国家科研项目如何与企业产品开发相协调、相统一,将是决定我国超级计算技术今后发展方向的一个重要因素。

3.2 现阶段国内超算行业应用水平

超级计算能力只有实际应用于国家安全与发展的重大行业,切实推动科技创新,提升工程设计和科学认识水平,才能实现其核心的价值。中国超算已经走过了以政府主导的机器研制带动应用发展的阶段,正在进入以应用需求引领系统研制的理性阶段。

在国家“ 863”计划相关重大项目的支持下,我国先后重点支持了物理化学、天文、气候气象、生物医药、新能源、流体仿真、大飞机、石油勘探地震成像等领域的超级计算应用,推动并研制出一批自主知识产权的重大行业应用软件系统,应用上也形成了若干千万级以上的处理器核进行并行计算模拟的应用实例,取得了一批重要成果,已经初步示范了能力型应用。

国家超级计算服务环境是在国家重大科研专项持续性支持下,聚合了国内优秀的高性能计算资源和丰富的应用软件资源,通过资源共享面向全国众多领域的用户提供了高性能计算与数据处理服务,支持了千余项国家各类科技计算和重要工程项目研究工作,初步形成了基础设施形态,已经成为我国经济、社会发展中不可或缺的组成部分。中国国家网格目前已经接入6个国家超级计算中心:无锡中心、天津中心、济南中心、深圳中心、长沙中心和广州中心。除此之外,各行业、各高校也趋向于统一建设高水平的超算中心,面向用户提供集约化的超算服务。而且还有独立运行的上海超级计算中心等一系列商业化超算服务建立起来。

http://www.cngrid.org/.

http://www.cngrid.org/.

我国在建设可持续发展社会,积极应对资源短缺、城市化进程等过程中出现了许多新情况和新挑战,国内超算行业也在积极探索新型的超算类型以应对这些挑战,如数据分析、机器学习、信息服务等应用类别占据了近年来TOP100排行榜接近50%的份额。曙光公司面向产业和用户的需求,在智慧城市应用服务工作中积极应用和推广自己掌握的超级计算技术,为信息安全、公共安全、城市管理探索了一条新的道路,这也充分证明了超算产业能够发挥科技进步对经济社会发展的支撑作用。

4 我国超算行业的机遇与挑战

当前中国正在面临产业结构升级、建设社会经济可持续发展的全面小康社会的关键阶段,作科技创新核心竞争力之一的超算行业正面临着一个全面发展的战略机遇。

《中国科学院“十三五”发展规划纲要》中明确提出,“重点围绕基础前沿交叉、先进材料、能源、生命与健康、海洋、资源生态环境、信息、光电空间等八个重大创新领域和有关重点方向,及国家重大科技基础设施、数据与计算平台等两类公共支撑平台,进行我院未来科技布局”。

在行业重大机遇的面前,中国超算行业也同样面临着重大挑战,“机会总是留给有准备的人”。

4.1 核心技术一定程度上还依赖国外

中国超算制造水平已经进入世界领先地位,但受限于信息产业的整体水平,使得中国超算产业核心技术突破的面不够宽,自主技术发展还较为缓慢。中国商用超算系统绝大部分采用国外厂商的芯片、系统和应用软件等,自主技术的超级计算机相对较少。

习近平总书记在2018年4月20日的全国网络安全和信息化工作会议上指出,“核心技术是国之重器。要下定决心、保持恒心、找准重心,加速推动信息领域核心技术突破”。国产芯片是中国信息技术(IT)产业的基石,是超级计算的核心技术。基石不稳,产业发展再绚烂都有随时倾覆可能。

与国外厂商的产品相比,国内企业、科研机构研制的核心技术往往在若干单点技术进行突破,距离形成系统的产业化生态环境差距巨大。例如,处理器的制造工艺落后1—2代,处理器的主频和单核性能较低;国产处理器的软硬件生态环境尚未完全建立,应用适配程度较低等。

4.2 超算应用软件研发与产业化、高水平应用人才培养和队伍建设亟待加强

由于我国超算行业刚刚进入快速发展的阶段,超算应用的生态环境尚未建立起来,高水平超算应用和人才队伍积累明显不足,主要体现在超算软件应用领域较窄,自主研发的并行应用软件不够丰富,各层次超算人才的培养有待加强。

中国超算行业中,很多重要应用还需要采购国外昂贵的商业软件。一些国家重大行业应用单位通过经验累积和摸索,研发了部分应用软件系统,但多数停留于自研自用;由于缺少相应的产业化工作,比如行业内认可的第三方验证和确认,商业推广应用能力不足,较难被行业更多用户认可。在传统超算应用行业之外,从业人员的思路限制及过高的入门门槛,使得规模化并行应用并不广泛,往往以跟随国外成熟软件的应用为主,缺乏应用创新性的动力。

现有的国家项目的组织机制和管理方法以中短期的项目资助模式为主,强调单点应用或技术的突破,而缺乏全局生态环境的顶层设计和产业化持续造血能力,从而导致项目结束之后,面临超算应用的后续迭代投入和产业化推广的困境。项目管理的方式也不能很好地适应超算软件的应用需求牵引、多学科交叉和协同创新的现实情况,因此急需新的组织管理和体制机制的创新。

4.3 超算基础设施的投入产出比需提升,进一步发挥对经济和产业的作用

近10年以来,在国家科技计划的大力支持下,国内超算环境的建设坚持公共性服务平台的属性取得了阶段性的丰硕成果,减少了由地方、行业或者企业自建超算中心而造成的资源重复投入的弊端。但公共性的超算中心往往在应用软件的开发能力和商业化运营上略有不足,运维费用和基础设施的升级依赖于外部政策性投入,因此往往给社会民众造成偏基础设施运维、投入大产出少的印象。

未来,国内超算中心要寻求可持续性发展,可在服务于国家、地方重大应用需求外,与用户合作加强基础应用软件的开发能力,并且跨出地方性服务范畴,将相关应用的开发经验、成果与行业、产业界横向辐射和联结,充分发挥超算中心对弥补产业软性短板、支撑产业经济发展的重要作用。

5 我国超算行业的破冰之道

超算行业的研发和生产需要长期投入和积累,它不是单一领域技术爆发,而是需要全方位科技进步为依托。我国应该抓住未来E级计算的契机,在战略层面上做好顶层规划,建立中国超算完整的生态环境。

5.1 超算行业发展需要国家战略统揽,构建完整的生态环境

超算产业具有技术复杂、研制周期长、投资巨大、参与部门多、辐射面广,无论是单一依靠政府项目投资引导,还是完全交给市场的产业性行为都是不现实的。超算行业必须在国家层面予以战略统筹,建立超算行业的组织机制和体制的创新,由政府主导制定出科学分析的、长期投资的、多部门合作的中长期远景规划,扎实推进百亿亿次及以上量级的超级计算研究、开发与部署应用。

我国超算行业不应该仅满足于维持超算系统的建造技术领先地位,还应努力构建一个涵盖系统硬件(尤其是高端芯片和其他核心器件)、系统软件、开发工具、应用软件甚至包括人才队伍的超算生态环境。同时,中国超算产业需要借鉴全球的先进技术和先进经验,既要坚持拥有独立自主的技术储备,也要主动和国际主流技术和标准进行接轨,以最大化善用前人丰富的技术积累。为了加快中国超算产业的发展进程,对于严重缺失的技术短板也应该采用“引进—消化—吸收—创新”的方式。这样才能保证在最短时间内弥齐产业链,从而确保中国超算行业中硬件和软件能够平衡地长效可持续发展,切实起到引领科技进步和带动社会经济发展的核心作用。

5.2 以应用需求为主线,以超算产业化为目标,加强超算产业生态链的建设

我国科技人员发挥自主创新的精神,不盲目跟随国外技术,而是立足中国的战略需求,敢为天下先,这是我国超算技术取得跨越式发展的一个重要原因。当前,我国正在推进国家创新体系建设,积极探索,大胆尝试,坚持脚踏实地与志存高远相结合,既着眼当前、解决经济发展中的瓶颈制约,又放眼未来、超前部署抢占未来制高点的重点领域,这对我国超级计算技术今后的进一步发展是尤为关键的。

中国超算企业应该充分发挥深刻理解市场需求的优势,结合产业和用户迫切需求进行技术研发布局,坚持自主创新,发展与应用安全可控的核心技术;对自身的高端技术进行技术下移,坚持设计与开发一流品质的产品,肩负起超算产业市场推广和产业辐射的重任。

企业借助自身市场优势进行广泛地科研创新和产业化合作,支持用户将高端技术“走出去,用起来”。在中国科学院领导的大力支持下,曙光公司牵头成立了“中科院先进计算技术创新与产业化联盟”并担任理事长单位,在中国科学院创新链、产业链“两链嫁接”中走在行动的前列。

2018年,在国家发改委的指导下,曙光公司又联合多家上下游企业、科研院所、知名高校牵头成立了“国家先进计算产业创新中心”,建立了以企业为主体、资本为纽带、国家重大需求为牵引、技术与资本深度融合、平台与成果开放共享的高效运行机制,在多方协同建设“产学研用”生态、体制机制创新方面做了有益的探索。

5.3 关注超算产业的可持续发展,加强超算应用辐射能力的建设

在超算产业发展良好的趋势下,我们应该清醒地认识到,如何利用好已有的历史积累促进中国超算产业可持续性发展还任重而道远。

在新的超算产业发展历史时期,我们应该鼓励超算中心根据区域产业和合作单位的优势领域,把现有的超算中心建设成为各具特色的、聚焦于不同学科领域的合作交流平台、人才培养平台和应用开发平台,紧跟技术发展趋势,缩短创新技术的产业化链条,形成科技创新带动的产业化集群中心,更多地服务于区域产业结构升级,带动区域经济转型升级和社会民生服务。

超算产业必须以人为本,建立以前沿交叉技术为核心的人才队伍,现阶段来看,我国超算产业的人才队伍明显不足。国家应该鼓励高校和企业合作,需要积极拓展多种形式的学术界和产业界人才培养的模式,加强国内外人才交流合作,推进中国超算产业、应用技术和科技创新的辐射能力。

6 中国超算业的发展趋势展望

目前,各国普遍预计到2020—2021年,E级超级计算机将登上历史舞台,因此E级超级计算机是当前世界各国竞相角逐的战略制高点。从P级计算到E级计算不简单地是一个性能指标上的提升,E级计算在能耗、性能、可扩展性、可靠性、生态环境、应用编程、应用效率与适应性、多领域应用融合等诸多方面面临着前所未有的挑战。我国的“神威”“天河”和“曙光”已经研制成功了3台E级原型机,验证了部分E级超算的核心技术路线,达到了世界超算技术前列。

在中国科学院领导的大力支持下,曙光公司已经研制成功与现有主流技术标准和生态环境完全兼容的、性能全球领先的超级计算机,尤其采用了全新的相变液冷技术,基本达到现有硅基芯片制冷的极限散热能力。在中国科学院相关单位的支持下,初步建立了完整的生态环境,有希望探索出一条新的超算产业发展路径。

在后E级时代,半导体工艺已逐步逼近其物理极限,传统冯·诺依曼架构的瓶颈日益凸显。超导计算机、量子计算机、类脑计算机、生物计算机、光计算机等新型计算机系统已经开始研发。不过在短期内,基于硅基半导体工艺的传统超级计算技术仍然是主流,但长期来看,这些新技术具有很好的发展前景。

超级计算机的传统应用领域是科学研究,如气象预测、石油勘探、CAE仿真、新材料研究、新药发现、基因测序等。但时至今日,超算应用领域早已扩展至互联网、物联网、人工智能等领域,超级计算技术也渗透到了人们日常生活的方方面面。目前,超级计算机支撑着我们几乎所有的大型信息基础设施;未来,其也将成为城市的智慧大脑,汇聚海量数据,优化城市管理和服务,改善市民生活质量,为我们创造更加美好的生活。