登录窗口
作者登录 审稿登录 编辑登录 读者登录
订阅 | 旧版入口 | English
 
  • 首页
  • 期刊简介
  • 编委会
  • 作者投稿
  • 订阅指南
  • 联系我们
  • 过刊目录
首页>战略与政策>丛斌院士:生命科学进化带来的思考
丛斌院士:生命科学进化带来的思考
发布时间:2024-08-19   
   来源:光明日报   作者:丛斌
点击数量:159次

光明图片/视觉中国

光明图片/视觉中国

光明图片/视觉中国

光明图片/视觉中国

生命科学的发展进程与自然界生物物种进化过程类似,都是由简单到复杂,由单一到多样,由低级到高级。因此,可以把生命科学的发展进程类比为生命科学进化。

目前,全世界范围内科技领域都存在“三多三少”的现象——科技投入越来越多、论文越来越多、专利越来越多,但颠覆性成果越来越少、原始创新越来越少、专利转化越来越少。科学技术创新模式面临挑战。就医学科学而言,如何确立医学领域的前沿科学问题,突破人类的认知边界,实现“从0到1”的突破,是生命科学进化带给我们的深刻思考。

      科学研究范式的变革

当前,新一轮科技革命和产业变革突飞猛进,学科交叉融合趋势凸显,国际科技竞争向基础前沿转移。国际学术期刊《科学》在庆祝其创刊125周年时,公布了125个最具挑战性的科学问题。其中涉及生命科学的问题占46%,关系宇宙和地球的问题占16%,与物质科学相关的问题占14%以上,认知科学问题占9%,其余问题分别涉及数学与计算机科学、政治与经济、能源、环境和人口等。

这125个科学问题,从基础科学角度可归纳为三个基本问题,即对物质本质、宇宙起源、生命本质的探索。一旦这些问题获得突破,将是科学技术革命性的工作,是突破人类认知边界的重大创新。揭示物质的本质是为了破解能量和物质形成之间的关系和能量聚集成物质(宇宙中63种基本粒子)的过程;研究宇宙的起源是为了破解信息和能量传递、转换的机制,物质传送速度的机制;破解生命的本质是为了揭示生命物质互作的复杂网络动态运行机制,为探索决定生命、健康、疾病的分子网络调控规律提供科学基础。

基于上述科学问题的导向,科学研究范式急需深刻变革。

科学研究范式是20世纪60年代由美国科学家托马斯·库恩提出的。科学研究范式是指从事某一领域研究的科学共同体所共同遵从的信念、理论、价值观、科研行为方式,是科学工作赖以维持运转的学理基础和实践规范。当原有的范式已不能实现科学理论的实质性突破,甚至是理论之间多有冲突时,科学研究范式就会转变。2007年,图灵奖得主吉姆·格雷提出:“信息爆炸迫使科学家必须将实验、理论和计算机计算统一起来,建立起一种新的科学研究范式,数据密集型的科学发现(Data-intensive Scientific Discovery),即‘第四范式’。研究内容由局部走向系统,方法由单一学科走向学科交叉,范畴由多层分科走向探索共性。”

纵观人类发展历史,我们共经历了四次科学研究范式的转变。第一范式是实验科学范式,即基于实验或经验的归纳总结(Describing natural phenomena)来发现规律的科学范式,钻木取火、比萨斜塔实验、拉瓦锡发现的质量守恒定律等,都属于第一范式。文艺复兴以后,第二范式即理论科学开始备受推崇,它是以理论为基础开展研究,通过建立数学模型和理论框架(Using models,generalizations)演算、归纳总结,来解释自然现象的科学范式,代表性研究为牛顿定律、麦克斯韦方程、门捷列夫的元素周期律、相对论等。第三范式是计算机科学范式,即利用计算机仿真模拟复杂自然现象(Simulating complex phenomena),用计算机和AI模拟代替实验研究、预测结果的科学范式,如量子化学计算分子动力学模拟、天气预报模拟、核试验模拟、复杂化学反应模拟等。第四范式是数据密集驱动的范式,即以数据密集和智能驱动研究,发现其中的相关知识和规律的研究范式。这种范式通过实验、采集数据或模拟器仿真产生数据,建立数据集,采用数据挖掘、降维、升维、机器学习等方法分析计算,预测物质性质、揭示物质互作规律等,获取之前未知的新知识。

       生命科学研究的困惑

今天的科学研究范式已经进展到第四范式,但对生命科学,尤其是医学科学的研究来讲,还大多停留在第一范式,即试图通过生物学实验探索一个复杂事物的规律;也很少采用第二范式,很少用数理逻辑表征事物之间的逻辑关系;即便是目前蓬勃兴起的元宇宙技术和数字孪生技术,实际上也仅停留在第三范式。要进行未知的生命本质研究,必须将科学研究范式推进到第四范式,而其关键就在于大数据的收集。数据和AI有着极为密切的关系,如果把AI比作工具,数据就是生产资料,只有数据的质量和数量达到一定程度,才能被AI工具有效利用。如果原始数据的收集很粗糙,就无法转换为特征性的数据表征,AI也就不能得出正确结论。

20世纪,生物学从传统的描述性科学转变成为假设驱动的实验科学。与此紧密联系的是,还原论占据了统治地位,即对复杂生命系统的理解可以通过将其拆解为组成部件并逐个研究。在这种分子生物学“范式”的指导下,试图通过认识单个基因或蛋白质的结构与功能来阐释个体的生理或病理活动。然而,细胞内的真实世界并非如此。事实上,我们很难找到真实世界的因果关系,即一个原因必须是一个结果的充分条件。例如,在真实生命的复杂系统中,mRNA表达水平及其翻译产生的蛋白质丰度之间存在着复杂的非线性关系。

由于慢性病威胁日益增大,现代医学正进入一个新的转型时期,有三种主要发展趋势值得我们关注:一是从简单性思维的分子生物医学转变到复杂性思维的系统生物医学;二是从基于统计研究证据的循证医学转变到关注个体分子特征的精确医学;三是从以治病为中心的临床医学转变到以健康为中心的健康医学。

要想实现这几个转变,我们需要厘清目前在生命科学领域,尤其是医学领域亟待解决的基本科学问题。在生命科学领域的研究中,不能仅局限于用先进的观测手段揭示亚细胞水平或分子水平的微观结构,因为这些被发现的静态结构并不能表征生命的微观动态过程。一定的组织结构必定为执行一定的功能而存在。细胞、亚细胞或分子水平的微观生命活动,是基于一定的结构存在所表征的结构间系统互作,并以这种互作行使一定功能的时空变化动态过程。这就需要我们一要解析细胞内的空间结构;二要揭示细胞内结构间的网络化系统互作表征;三要探索细胞内结构间系统互作的网络化动态时空演变规律。因此,要建立新的范式研究生命科学领域的这三大基本科学问题。

      系统生物学拨云见日

系统生物学通过整合经典的分子细胞生物学、新兴的生命组学以及信息科学和数学等非生物学科的研究策略和方法,对生命复杂系统及其生理病理活动进行系统性、整体性的检测和分析。当前,系统生物学已成为生物学研究方法的主流。生命组学变化的多维度研究,可以揭示生物分子间系统性、网络化、时相性互作的生命活动规律。

系统生物学是一门注重定量研究的学科,不仅注重分子细胞生物学和组学等“湿实验”(第一范式),也同样注重信息科学和计算生物学等“干实验”(第二范式、第三范式)。成功的系统生物学研究应该是“干实验”与“湿实验”的紧密结合。

人体细胞内是一个多元异构的网络化复杂巨系统,要破解上述三大基本科学问题,需要从揭示细胞内复杂表型的发生与发展的动态过程入手。复杂表型涉及DNA、RNA、蛋白质及表观遗传等多个分子水平的共同作用形式。由于研究策略和分析方法的限制,既往的机制研究缺乏对不同分子水平组学数据的整合分析,无法实现对复杂表型分子机制的充分解释。因此,有效整合DNA、RNA、蛋白质、表观遗传等多组学数据,不仅可系统揭示复杂表型发生与发展的调控网络与分子特征,阐释其复杂分子机制,还有助于确定多组学分子标志物,在推进分子机制研究的基础上,实现从分子机制理解到疾病诊疗转化应用的跨越式发展,为建立风险评估与精准疾病诊疗模型以及探索有效的监测与预警方法奠定基础。具体思路如下:

第一步是对细胞内多源异构生物数据分子特征的提取。

高通量技术的发展产生了大量与基因、蛋白质和代谢相关的生物组学数据。从这些多源异构的生物组学数据中发现和提炼与疾病相关的信息,需要借助特征衍生的方法获取具有高区分性的特征。目前常用的特征衍生方法主要是对现有特征进行线性或非线性的变换,如四则运算特征衍生、交叉组合特征衍生、分组统计特征衍生等。然而,在特征衍生的过程中往往会产生大量无效或者低效的特征。如果把这些冗余特征带入模型中,会形成维度灾难,使建模工作无法在合理时间内有效完成,且冗余信息往往会造成干扰,导致真正有效的信息被掩盖,模型预测效能降低。通过模式识别中的特征选择技术,对高维生物组学数据中蕴藏的重要信息进行提取、筛选、识别和分类,也是生物组学数据整合分析的关键步骤。编码器接受原始特征输入,将原始特征转换成低维的新特征,解码器接受新特征并将新特征升维至与原始数据相同的维度,以达到有效数据降维和分子特征提取的目的。

第二步是选择模型,把降维后的数据带入模型,针对不同的任务选择不同模型。

不同模型对于输入数据的要求不同,因此需要在输入数据之前对数据进行预处理,若选择多层感知机和集成学习模型,需要进行多组学数据的表征合并;若选择卷积神经网络和图神经网络模型,需要进行高维度表征变换。这样可以将有效特征压缩并进行低维映射,构建交互调控网络,对细胞事件进行预测。对于多组学数据的模型选择,目前并没有一个金标准,往往需要根据具体任务进行选择。

值得注意的是,目前所有原生人工智能算法的开发都基于非生命体的工程数据,并不能完全适配以动态时空变化为主要异质性特征的生物类数据。因此,适配人工智能模型的开发和各级分子互作关系数据库的构建是生物组学数据整合与交互调控网络解析的关键和瓶颈,需要学科交叉进行联合攻关。

现代生命实验科学的主要目的是探寻事物之间的因果关系,但从大数据中获得的生命科学知识基本上是相关性的,而非因果性的。生物体是一个复杂网络的巨系统,研究者不能控制任何一个生理或病理活动涉及的所有变量。数据驱动的研究不依赖于假设,因而研究者不仅可以避开现存理论的限制,以及对“实验事实”的主观性选择和判断,还可以利用各种算法对获得的大数据进行分析,进而发现全新的现象或者事物之间隐藏着的内在联系。数据驱动的生命科学研究新范式并不追求结果的完备性。它采用的是一种全新的工作模式——迭代(iterate),即每一次研究工作获得的成果都不是完备的,需要未来研究者在已有版本的基础上不断完善并产生新版本,就像人类基因组从研究启动到今天的几次迭代不断完善一样。知识就像“未知海洋”中的“岛屿”,随着“知识岛屿”的扩大,“未知水域”同样也在扩大。不断拓展人类认知边界的挑战在于此,探索未知的乐趣也在于此。

(作者:丛斌,系全国人大宪法和法律委员会副主任委员、中国工程院院士)





推荐文章
  • 油气安全战略与“双碳”战略:关系与路径
    百年变局叠加世纪疫情给全球能源安全敲响警钟,深刻理解能源转型...
  • 2023年中国经济增长速度的预测分析与政策建议
    受新冠肺炎疫情及采取的对应措施等因素的影响,2022年中国经...
  • 《2022研究前沿》——11个大学科领域发展趋势与重点研究问题
    2022年12月,中国科学院科技战略咨询研究院、中国科学院文...
  • 《2022技术聚焦》——20个高影响力专利技术焦点分析解读
    2022年,中国科学院科技战略咨询研究院研制《2022技术聚...
  • 新时代科技强国战略
    科技强国是现代化强国的核心要义,科技现代化是中国式现代化的重...
  • 科技改革十年回顾与未来走向
    文章从科技宏观治理、攻关应急体制机制、科研人员全职业生涯、科...
专题
  • 专题:生物制造——回顾与展望
  • 专题:智慧农业的发展与思考
  • 专题:人工智能与公共安全
  • 专题:纪念中国科学院学部成立70周年
  • 专题:人工智能与未来社会
  • 专题:科技创新与产业创新深度融合
  • 专题:高端制造的现状与未来思考
  • 专题:国家关键技术战略的认识与对策
  • 专题:大力推进科研范式变革
  • 专题:国家公园现代化治理体系建设
  • 专题报道
  • 专题:新时期重大科技基础设施建设理论与实践
  • 专题:“十五五”区域协调发展与国土空间发展格局优化
  • 专题报道
  • 专题:黄河流域科技创新研究与对策
  • 专题:科技创新引领现代化产业体系建设
  • 专题:前沿科技伦理风险及其治理
  • 专题:中国能源发展战略研究
  • 专题:科技预算绩效评价的理论与实践
  • 专题:中国生态文明建设进展与成效
  • 专题:技术经济安全理论与实践
  • 专题:开放科学发展趋势与治理策略
  • 专题:综合防治荒漠化 打赢“三北”攻坚战
  • 专题:科技创新支撑“一带一路”高质量发展
  • 专题:主要“一带一路”共建国家气候变化影响和适应研究
  • 专题:跨越“中等技术陷阱”与实现中国式现代化
  • 专题:构建自立自强的信息技术体系
  • 专题:新材料科学发展战略思考与创新实践
  • 专题:智库双螺旋法应用及实证研究
  • 专题:海洋观测探测与安全保障技术
  • 专题:中国空间科学——战略与突破
  • 专题:科技与金融融合逻辑与建议
  • 专题:数据要素市场化配置问题探究
  • 专题:中国战略性关键矿产资源安全研究
  • 专题:“双循环”格局下中国区域创新
  • 专题:哲学助力科技创新
  • 专题:绿色“一带一路”建设的挑战与应对
  • 专题:服务碳中和目标的海洋负排放技术路径与战略思考
  • 专题:哲学与科学
  • 专题:生物多样性保护与生态文明
  • 专题:生态草牧业高质量发展
  • 专题:建党百年·青年说
  • 专题:碳中和目标背景下的能源转型
  • 专题:科技助力“黑土粮仓”建设
  • 专题:科技伦理治理的战略研究
  • 专题:有组织的基础研究
  • 专题:新时代科学基金运行体系与管理研究
  • 专题:融合科学与开放数据
  • 专题:黄河流域生态保护和高质量发展
  • 专题:科技领航黄河三角洲农业高新技术产业示范区高质量发展
  • 专题:湾区比较研究
  • 专题:荒漠化治理与可持续发展
  • 专题:“十四五”规划的区域战略与空间治理
  • 专题:长江经济带高质量发展
  • 专题:公共卫生应急体系建设的战略思考
  • 专题:环境污染与人体健康
  • 专题:科技评价——实践与展望
  • 专题:畜牧业可持续发展
  • 专题:水声信号处理和声呐技术·发展现状和展望
  • 专题:中国高性能计算发展战略
  • 专题:行星科学——新学科·新梦想
  • 专题:国际新形势下知识产权保护研究
  • 专题:中国科技70年·回顾与思考
  • 专题:战略生物资源的保护与利用
  • 专题:2030年可持续发展目标的理论、指标与实践
  • 专题:土壤与可持续发展
  • 专题:知识产权转化与运营
  • 专题:“丝绸之路经济带”中亚能源地缘配置与国家安全
  • 专题:科学普及问题政策研究
  • 专题:分子模块设计育种
  • 专题:环境微塑料污染与管控策略
  • 专题:中国科学院·改革开放四十年
  • 专题:传统工艺的认知与振兴
  • 专题:国家生态保护与建设工程生态成效评估
  • 专题:心理学与社会治理
  • 专题:大气灰霾追因与控制
  • 专题:中国微生物组计划
  • 专题:“一带一路”建设对策研究
  • 专题:土壤微生物组
  • 专题:建成遗产
  • 专题:作物病虫害的导向性防控
  • 专题:青藏高原综合科学研究进展
  • 专题:气候变化的全球治理
  • 专题:科技促进农业供给侧结构性改革
  • 专题:生物传感与器官芯片
  • 专题:“十三五”区域发展战略研究
  • 专题:分布式可再生能源和智能微网
  • 专题:2015/2016超级厄尔尼诺事件研究
  • 专题:精准扶贫重大战略与政策研究
  • 专题: 生物安全——新问题、新挑战
  • 专题:绿色设计
  • 专题:空间科技助力“一带一路”建设
  • 专题:信息化变革科研模式
  • 专题:“一带一路”生态风险与地缘战略
  • 专题:脑科学与类脑智能
  • 专题:现代智库建设及其思想传播
  • 专题:知识产权强国建设
  • 专题:海岸科学与可持续发展
  • 专题:心理健康研究与服务
  • 专题:当代国家凝聚力研究
  • 专题:海洋科学发展现状与展望
  • 专题:云计算创新发展战略
  • 专题:在线社交网络分析理论和技术
  • 专题:西藏经济社会与科技协同发展
  • 专题:土壤与生态环境安全
  • 专题:可持续发展从行动走向科学
  • 专题:创新发展政策研究
  • 专题:土壤与可持续发
  • 专题:落实全面深化改革的科技思考
  • 专题:生物计算机研究进展
  • 专题:科教国际化发展战略
  • 专题:互联网产业发展战略
  • 专题:标准化发展战略
  • 专题:土壤重金属污染治理
  • 专题:可持续发展的难点与热点
  • 专题:生态系统服务与评估
  • 专题:知识产权战略与创新驱动发展
  • 专题:我国空间科学发展的挑战和机遇
  • 专题:知识产权的法制保障
  • 专题:城镇化战略研究
  • 专题:现代农业
  • 专题:大气灰霾追因与控制
  • 专题:知识产权管理
  • 专题:科研信息化
  • 专题:农业物联网
  • 专题:国家创新平台建设
快速通道
作者登录
编辑登录
审稿登录
读者登录
过刊浏览
点击排行
下载排行
引用排行
RSS
E-mail
文件检索
返回首页

 
 
您是第34818291位访问者!
1996-2021 中国科学院版本所有 备案序号: 京ICP备05002857
地址:北京三里河路52号 邮编 100864 Email:bulletin@cashq.ac.cn
技术支持:北京勤云科技发展有限公司