生物技术与信息技术的融合发展
刘晓1 , 王跃1 , 毛开云1 , 范月蕾1 , 陶诚2 , 陈大明1     
1. 中国科学院上海生命科学研究院 中国科学院上海营养与健康研究所 上海 200031;
2. 中国科学院 发展规划局 北京 100864
摘要:生命是自复制、自适应和自组织的开放信息系统。基于现代信息技术的生命信息采集、处理、存储、整合、挖掘和解析,驱动生命科学研究进入“数据密集型科学发现(Data-Intensive Scientific Discovery)”的第四范式,使得生物技术向可定量、可计算、可调控、可预测的方向跃升。同时,从基因的表达与调控,到神经元的信息交换和处理过程,生物体中的信息处理过程为信息技术的发展带来无穷的启迪。生物技术与信息技术的融合发展,有其学科内涵的本质、工程发展的规律、时代和社会的要求,带来了日新月异的研究范式、日益月滋的创新突破和日益广泛的应用场景。加强生物技术和信息技术融合发展的前瞻性、战略性和系统性布局,对于抢占科技竞争和产业竞争的制高点,具有重要的意义。
关键词生物技术    信息技术    融合    工程    
Converge Development of Biotechnology and Information Technology
LIU Xiao1, WANG Yue1, MAO Kaiyun1, FAN Yuelei1, TAO Cheng2, CHEN Daming1     
1. Shanghai Institute of Nutrition and Health, Shanghai Institutes for Biological Sciences, Chinese Academy of Sciences, Shanghai 200031, China;
2. Bureau of Development and Planning, Chinese Academy of Sciences, Beijing 100864, China
Abstract: Life is an open information system that is self-replicating, adaptive, and self-organizing. The collection, processing, storage, integration, and analysis of biological information based on modern information technology (IT) propel life science research into the Fourth Paradigm of "Data-Intensive Scientific Discovery", which definitely will make biotechnology (BT) toward a quantitative, computable, controllable, and predictable direction. Meanwhile, from the expression and regulation of genes to the information exchange and processing of neurons, information processing in organisms has infinitely inspired the development of information technology. From this perspective, the convergent development approach of BT and IT has its own essences in discipline connotation, laws of engineering development, demands of our time and society, and has brought about the ever-changing research paradigm, the ever-increasing innovation and breakthrough, and the increasingly extensive application scenarios. So in this way, it is of great significance to seize the commanding heights of both technology and industry competition.
Keywords: biotechnology    information technology    converge    engineering    
1 生物技术与信息技术融合发展的意义

生物技术与信息技术的融合发展,其源头可追溯至物理学家埃尔温·薛定谔(Erwin Schrödinger)于1944年发表的《生命是什么?活细胞的物理学观》 [1]一书。在书中,薛定谔提出“是什么让生命系统似乎与已知的物理学定律相悖”的问题,启发了詹姆斯·沃森(James Watson)和弗朗西斯·克里克(Francis Crick)等物理学家投身生命科学的研究,进而发现DNA的双螺旋结构,开启了现代生命科学的发展。同时,薛定谔提出在生命系统中“必须努力找到一种新的物理定律”,这也启发了克劳德·香农(Claude Shannon)和诺伯特·维纳(Norbert Wiener)对于新概念的探索,并进而在“信息”的探索中分别提出了信息论和控制论。以此为起点,20世纪下半叶,生物技术和信息技术分别沿着各自的轨迹渐进发展。1990年正式启动的“人类基因组计划”,使得人们从“三论”(系统论、控制论和信息论)的角度重新审视生命科学的发展规律。“人类基因组计划”最早的倡导者之一莱诺伊·胡德(Leroy Hood)提出了“系统生物学” [2]研究的必要性,并进而提出预见性(predictive)、预防性(preventive)、个性化(personalized)和参与性(participatory)的“4P医学”发展方向[3]。此外,美国麻省理工学院从控制论的角度审视了“系统生物学”在合成生物学中的应用[4]。由此,生物技术与信息技术融合发展的序幕已经徐徐拉开。

1.1 生物技术和信息技术的融合发展,已成为新一轮科技革命的重要驱动力

总体上看,信息技术在生命科学研究和生物技术开发方面的规模化应用,早于生物技术驱动信息技术的发展。早在20世纪80年代,生物信息学[5]已经成为生命科学研究的重要工具,发达国家顺势布局建立了美国国立生物技术信息中心(NCBI)数据库、欧洲生物信息学研究所(EBI)数据库和日本DNA数据库(DDBJ)三大数据库。“人类基因组计划”的开展,引发了基因组、转录组、表观遗传组、蛋白质组、代谢组等生命科学组学数据的急剧增长,推动了信息技术在生命科学领域的大规模应用,驱动生命科学研究进入“数据密集型科学发现(Data-Intensive Scientific Discovery)”的第四范式[6]时代。由此,生物技术实现了信息化、工程化、系统化的发展,为“设计—构建—验证(Design-Build-Test)” [7]循环模式的建立奠定了坚实的基础,并朝着可定量、可计算、可调控和可预测的方向跃升。

信息技术的引入,使得生命科学从“实验驱动”向“数据驱动”转型发展,而生物体内的信息处理过程也为信息技术的发展带来了无穷的启迪。随着当前科技逐步逼近香农定律的理论瓶颈、内存墙的冯·诺伊曼瓶颈、摩尔定律的工程瓶颈,科技界和产业界将目光投向了DNA存储、神经形态芯片、生物启发计算等交叉技术领域。例如,2013年10月美国半导体研究联盟(SRC)便启动了“半导体合成生物技术”(semiconductor synthetic biology,SSB)研究项目,以研究受生物启发的半导体系统,加深对未来信息通信技术的认识,把握战略机遇。美国于2018年首次发布的“半导体合成生物学路线图”,将生物技术的引入视为半导体领域发展的重要机遇。从这个角度看,生物技术在信息技术领域的应用,着眼点是大数据存储、高性能计算等方面的需求瓶颈,进而从仿生、似生、创生、再生等角度出发寻求新的解决方案。

生物技术的研究发展是对信息技术的有力支撑,信息技术的“瓶颈”解决需要从生物技术发展寻求启示;生物技术与信息技术的融合发展进入了相互推动、齐头并进的时代,并成为新一轮科技革命和产业变革的重大推动力和战略制高点。生物技术、信息技术与纳米技术等融合形成的“会聚技术”(converging technologies),将产生难以估量的效能[8]:“如果认知科学家能够想到它,纳米科学家就能够制造它,生物科学家就能够使用它,信息科学家就能够监视和控制它”。从这个角度看,生物技术和信息技术的“1+1”融合发展,或将产生“11”的巨大效能。

1.2 生物技术和信息技术的融合发展,已成为大国和创新企业的战略选择

早在2001年,美国商务部、国家科学基金会(NSF)、国家科学技术委员会(NSTC)在华盛顿联合发起由生物技术、信息技术、纳米技术等领域的顶级专家参加的圆桌会议,探讨“会聚技术”的布局前景。由此开始,美国各界高度重视信息技术与生物技术的融合。例如,美国国防高级研究计划局(DARPA)的诸多项目布局中均体现了生物技术与信息技术融合发展的趋势。在生物技术领域,美国融合各界共识形成的《 21世纪的新生物学》《会聚观》等报告认为,信息技术等的会聚已经是生物技术发展的核心驱动力,为此美国在“脑科学计划”“精准医学计划”等重大计划中均广泛运用信息技术融合手段。在信息技术领域,美国半导体研究联盟将目光瞄准了“半导体合成生物学”并加以重点布局。总体上看,这一布局的发展历程,与人类社会的信息量增长有着或多或少的联系:生物技术的大发展,催生了大数据存储和分析的需求;信息技术的大发展,加速了受生物启发的解决方案的开发。在这一背景下,欧洲和日本也在加速布局。

除国家层面的布局外,谷歌、微软等信息技术企业纷纷与生物技术企业开展战略合作。比较典型的是,多个大型医药企业或医药投资者纷纷与信息技术企业开展合作,加速融合布局(图 1)。例如,在大数据和人工智能领域,美国麻省理工学院已与安进、巴斯夫、拜耳、礼来、Sunovion制药等医药公司开展机器学习方法的合作。再如,半导体设备的龙头企业泛林(Lam Research)公司已成立投资机构加速半导体合成生物学研究等方面的布局。

图 1 医药企业与信息技术企业的融合布局 列举的企业中,方框底色为灰色:表示公司属于信息技术行业;方框底色为蓝色:表示公司属于生物技术行业;方框底色为蓝色和灰色,表示公司属于涉及生物技术和信息技术融合的企业;蓝色箭头:表示双方企业是合作关系;紫色箭头:表示双方企业是资助与被资助的关系
1.3 生物技术和信息技术的融合发展,或将催生诸多的新兴布局空间

从美国“脑科学计划” “国家微生物组计划”“人类细胞图谱计划”等的资助项目可以看出,生物技术与信息技术的深度融合,还将促进3D细胞打印、人机智能等颠覆性技术的发展,并由此带动系统科学和系统工程的发展,推动农业、工业、健康、环境、交通等领域的新布局(图 2)。综合分析来看,已有的诸多研究布局,都是在这种背景下展开。

图 2 生物技术与信息技术融合带来的新布局空间示例 实心圆圈和半圆圈:表示领域交叉融合后产生的新领域;图片:表示已经布局的交叉领域项目或计划的举例。其中,生命组学与通信领域的交叉融合,将带来移动医疗、可穿戴设备、电子处方等的发展;与半导体领域的交叉融合,将促进生物CAD/CAM、电子细胞等的发展;与脑科学领域的交叉融合,将促进3D生物学、计算神经科学等的发展;与互联网领域的交叉融合,将带来远程医疗、人机交互等的发展

其中,比较典型的项目是,美国DARPA和美国情报高级研究计划局(IARPA)促进生物技术与信息技术融合发展的研究项目布局(图 3①②。整体上看,近年来这两大机构的诸多布局,都是在上述的新布局空间背景下展开。

图 3 美国国防高级研究计划局(DARPA)和美国情报高级研究计划局(IARPA)的生物技术与信息技术融合布局项目示例 图 2为基础,将DARPA和IARPA布局的相关项目列入相应的交叉领域

https://www.darpa.mil/our-research.

https://www.iarpa.gov/index.php/research-programs.

2 生物技术与信息技术融合发展带来的变革

生物技术与信息技术的融合发展,至少将带来8个方面的重大变革。

2.1 研究新范式

信息技术的深度融入,使得现代生命科学研究范式发展成为集人工智能驱动的生物设计和生物模拟(“干实验”)、自动化驱使的实验研究(“湿实验”)于一体的计算机辅助生物学(Computer-Aided Biology,CAB)[9]范式;并促进了“假设驱动的科学”(Hypothesis-driven Science)[10]先是向“发现驱动的科学”(Discovery-driven Science)[11]的跃升,进而实现“数据密集型科学发现(Data-Intensive Scientific Discovery)”,从而驱动“格物致知”与“建物致知”的有机融合,同时也在“设计—构建—验证—学习—设计”的反馈循环中推动信息架构设计、信息科学理论、信息技术开发的跃迁。

多学科、多要素、多层次、跨学科、跨领域、跨区域的生命科学研究,在阐明生命系统的层次、结构、演化的同时,也促成了整体性、关联性、等级结构性、动态性、平衡性和时序性等新研究发展,从而为系统论、控制论、信息论、耗散结构论、协同论和突变论的研究发展提供了新途径。

2.2 科学新发现

生命系统和信息系统都是下级结构有序形成上级结构、上层设计约束下层单元的有序系统:分子组成细胞,细胞构成组织,组织形成器官,器官形成系统;晶体管组成逻辑门,逻辑门组成模块,模块组成计算机,计算机连接成互联网,这些系统的组成、结构、功能、运行和发展规律,有其可类比之处。在生物技术与信息技术的深度融合发展中,人们对于结构和功能、整体与部分、运行与调控的基本规律认知,必将推动生命科学和信息科学的新发现,提升系统科学和智能科学的新认知。

2.3 技术新发明

生命信息的感知、存储和计算,已经催生了生物传感器和生物纳米物联网(IoBNT)技术、生物启发的信息通讯技术(BICT)、基因测序、基因合成和DNA存储、系统生物学分析、人工突触、人机交互和神经调节等技术的开发,同时也带动了生物学计算机辅助设计(BioCAD)工具和合成生物学开放语言(SBOL)等“基础设施”的开发,极大地丰富了现代生物技术的生态。可以预见的是,生物技术和信息技术的融合,或将成为“会聚技术”发展的源头动力,进而在与其他技术的融合发展带动“涌现效应”的发生。

2.4 产业新模式

生物技术和信息技术的融合,更将全面改变农业、工业和服务业的业态,驱动产业的新突破,带来新产品、新业态和新模式的发展(图 4),驱动精密仪器和装备、软件和系统工具、3D打印和4D打印等服务的创新。同时,两者的融合或将产生集数据驱动型的“干实验室”和自动化使能的“湿实验室”一体化的“云端实验室”,在改变科学研究模式的同时,将带来协同研究和转化研究的新发展。

图 4 生物技术和信息技术融合发展带来的产业新模式示例 最左侧一列:信息技术领域;最右侧一列:生物技术领域;中间部分(从下到上):第一、二层为基础研究、采集层,第三层为信息层,第四层为知识层,第五层为应用层
2.5 健康新理念

生物技术和信息技术的融合发展,将使“生物-社会-心理-环境”医学模式具备强大的技术支撑,进而将该医学模式的理论优势转化为实践优势,促成以“疾病”为中心向以“健康”为中心的转变、从“治已病”向注重“治未病”的转变、从“单一要素防控”向“全方位干预健康影响因素”的转变、从“依靠卫生健康系统”向“社会整体联动”的转变、从“服务部分人群”向“维护全生命周期健康”的转变。此外,使“每个人都是自己健康的第一责任人”理念得到健康状态辨识、健康风险评估、健康自主管理和健康主动促进等技术的全面支持。从而,构建起支撑从尚未出生的胎儿到老年人群、贯穿家庭社区和医院的健康信息平台,消除数据壁垒,畅通共享通道,推动医学取得突破,帮助百姓获得实惠;推动覆盖全生命周期的健康管理服务、支持全链条管理的重大慢性疾病防治,实现预防、治疗、康复和自我保健管理一体化发展。综合来看,在技术交叉融合的驱动下,健康管理或将实现早发现、早诊断、早干预的“关口前移”,数字化、个性化、精准化的“一人一方案、一病一路径”,全面筛查、全程管理、全民健康的“全方位诊疗”,以进一步满足人民群众的健康需求。

2.6 制造新能力

信息技术的引入,使生物技术的工程化开发有了强有力的工具支撑,从而使在DNA合成、细胞制造等方面的能力实现质的突破。以DNA合成为例,半导体技术的引入促进了新的发展:第二代DNA合成仪的开发借鉴了半导体技术,通过半导体工艺引入发展了物理掩膜法原位合成仪器、光敏保护基团介导的光控原位合成仪器、基于电化学介导酸脱保护合成方法的半导体原位合成仪器、喷墨式打印DNA原位合成仪器、基于硅片的喷墨式合成仪器及原位拼接技术等。其中,基于硅片的喷墨式合成仪的开发,或将意味着这一领域走出类似“摩尔定律”的路径,并为第三代DNA合成仪的开发提供基础支撑(酶法合成或许也可以与基于硅片的喷墨式平台相结合)。

细胞制造的产业发展,或将经历类似半导体领域的从“垂直一体化”向“垂直分工”的分化发展,形成“设计—制造—测试”的垂直链条分工,即“细胞设计”“细胞制造”和“细胞测试(分为基本质量控制测试和临床应用测试)”三大环节,由价值链上的不同企业分工来完成。2017年,美国国家细胞制造协会(NCMC)发布了《面向2025年大规模、低成本、可复制、高质量的细胞制造技术路线图》的更新版,从其定义的细胞处理,细胞保存、分配与操作,处理监测与质量控制、标准化与监管支持,以及员工发展等环节,也可以看出分工协同的思路。因而,细胞制造的成本或将也以类似“摩尔定律”的路径下降,从而带来生物制造能力的巨大突破。

上述方面的突破,将为信息技术的发展带来新空间。例如,美国发布的“半导体合成生物学路线图”提出了“高能效、小规模、细胞启发的信息系统”的开发方向。通过编程细胞机器与半导体平台的相互作用,“生物-半导体混合系统”或将具有超过传统电子设备的、前所未有的能力,能够对环境信号进行连续复杂的计算。这些创新产品的制造能力升级,将带来空前的发展潜能。

2.7 环境新要素

对人体健康而言,水、土、大气等传统环境要素,分子、细胞、组织、器官和个体水平的内环境,以及近人体空间的“小环境”等“新要素”,都是不可或缺的环境要素。囿于技术手段,关于这些环境“新要素”的研究在以往相对较少,而生物技术和信息技术的发展或将把这些环境“新要素”与传统环境要素结合起来,使其在人体安康、家庭安居、社会安全中的作用得到更为充分的研究,从而为包括信息技术产品在内的新场景、新技术、新标准、新体系开发提供有力支撑(图 5)。

图 5 以“环境-健康”关系为核心的知识图谱示意图 实心亮圆圈:代表寒冷、光照等外部环境条件;中心两层圈:代表血氧、血脂等人体生理指标。由外部环境到体内生理指标会经过各种代谢或信号通路,图中仅为简要示意图,旨在说明揭示“环境-健康”的内在关系,待计划开展后绘制的图谱将在深度、广度、精度上远超示意图
2.8 农业新发展

生物技术和信息技术的交叉融合发展,推动了以种源农业、智慧农业、绿色农业等为特色的健康农业新体系的建构,提供了名、特、优、新的产品和生产、生活、生态、生息“四生共融”的功能,从而使农产品消费模式由追求温饱型转变为追求安全、营养、健康型。美国国家科学院(NAS)在《面向2030年推动食品和农业研究的科学突破》 [12]中指出:高精度、精准、可现场部署的生物传感器等系列传感器是未来发展的底层技术;实验室研究和生产实践中的数据脱节是当前的主要瓶颈;将基因组信息、先进育种技术和精确育种方法纳入常规育种和选择计划是未来的必要选择;而土壤和植物微生物组之间的相互作用表征和信息分析则至关重要。

3 促进生物技术与信息技术融合发展的建议

与发达国家相比,我国在生物技术和信息技术的基础性、先导性、颠覆性布局上仍存在短板,主要表现为生命科学信息的采集和分析所需的仪器、工具以及平台严重依赖国外;在生物技术和信息技术融合发展方面的前沿技术布局系统性不够;在融合发展带来的范式和模式转变等方面的认知有待进一步深入等。面对未来战略竞争制高点,建议在以下领域率先布局,推动我国高新技术向质量效能型和科技密集型转变。

(1)开发关键共性工具,支持发展“所需”。针对高维度、跨尺度和多模态的生命信息采集工具、分析仪器、设计软件、模拟环境和验证体系,仿生感知、通讯、计算和控制所需的基础元件、器件和模块等方面,面向战略制高点率先布局关键共性工具的开发,在工具的“设计—构建—测试—应用—学习”循环中驱动工具开发能力的“螺旋式”上升。

(2)布局前沿引领技术,实现自主“所有”。针对DNA存储与计算技术、细胞半导体界面、3D生物学分析和仿真技术、人机智能交互技术等前沿技术领域,以类似“摩尔定律”的性能升级路径为导向,制定关键技术战略发展路线图,并依据路线图采取工程化的模式加以布局实施。

(3)构建使能技术平台,支持协同“所创”。以构建生命健康数据平台、智能化细胞构建与制造平台、基于大数据和人工智能的使能技术平台为切入点,促成会聚范式的形成,推动理念融合、技术集成和工程协同,实现高效的协同创新发展。

参考文献
[1]
Schrödinger E. What is Life? The Physical Aspect of the Living Cell. Cambridge: Cambridge University Press, 1944.
[2]
Hood L. Systems biology:New opportunities arising from genomics, proteomics and beyond. Experimental Hematology, 1998, 26(8): 681.
[3]
Auffray C, Charron D, Hood L. Predictive, preventive, personalized and participatory medicine:Back to the future. Genome Medicine, 2010, 2: 57. DOI:10.1186/gm178
[4]
Iglesias P A, Ingalls B P. Control Theory and Systems Biology. Cambridge: The MIT Press, 2009.
[5]
陈润生. 生物信息学. 生物物理学报, 1999, 15(1): 5-12.
[6]
Hey T, Tansley S, Tolle K. The Fourth Paradigm:DataIntensive Scientific Discovery. Redmond, WA: Microsoft Research, 2009.
[7]
Esvelt K M, Wang H H. Genome-scale engineering for systems and synthetic biology. Molecular Systems Biology, 2013, 9: 641. DOI:10.1038/msb.2012.66
[8]
Roco M C, Bainbridge W S. Converging technologies for improving human performance:Integrating from the nanoscale. Journal of Nanoparticle Research, 2002, 4(4): 281-295. DOI:10.1023/A:1021152023349
[9]
Fell T, Ward S, Gershater M, et al. Computer Aided Biology, Delivering biotechnology in the 21st century. London: Synthace Limited, 2018.
[10]
Kell D B, Oliver S G. Here is the evidence, now what is the hypothesis? The complementary roles of inductive and hypothesis-driven science in the post-genomic era. BioEssays, 2004, 26(1): 99-105. DOI:10.1002/bies.10385
[11]
Cornelius C. Science in the national vision for space exploration:Objectives and constituencies of the 'discoverydriven' paradigm. Space Policy, 2005, 21(1): 41-48. DOI:10.1016/j.spacepol.2004.11.004
[12]
National Academies of Sciences, Engineering, and Medicine. Science Breakthroughs to Advance Food and Agricultural Research by 2030. Washington DC: The National Academies Press, 2019.