2. 清华大学 工业生物催化教育部重点实验室 北京 100084;
3. 清华大学 合成与系统生物学中心 北京 100084;
4. 新疆大学 智能科学与技术学院(未来技术学院)乌鲁木齐 830049;
5. 北京理工大学 化学与化工学院生物化工研究所/医药分子科学与制剂工程工信部重点实验室 北京 100081
2. Key Laboratory for Industrial Biocatalysis, Ministry of Education, Tsinghua University, Beijing 100084, China;
3. Center for Synthetic and Systems Biology, Tsinghua University, Beijing 100084, China;
4. School of Intelligence Science and Technology (School of Future Technology), Urumqi 830049, China;
5. Institute of Biochemistry and Chemical Engineering, School of Chemistry and Chemical Engineering, Beijing Institute of Technology/Key Laboratory of Medicinal Molecular Science and Pharmaceutical Engineering, Beijing 100081, China
绿色制造是综合考虑环境影响和资源效益的现代化制造模式,而绿色生物制造作为绿色制造重要的方式之一,具有得天独厚的优势。绿色生物制造以生物细胞及其酶的反应过程为核心,以CO2、木质纤维素、农作物废弃物、其他可再生生物基碳源等为原料,生产燃料、药物分子、材料、大宗化学品和食品等低碳、可持续发展产品,实现原料获取、过程制造的绿色化和低碳化[1]。绿色生物制造可以实现资源的高效利用和环境的可持续发展,是国家提出大力发展的新质生产力的重要组成部分。绿色生物制造以高科技、高性能、高质量等为特征,完美契合新质生产力,是符合新发展理念的先进生产力质态。
高性能细胞工厂作为绿色生物制造的核心,是工业发酵过程的主体。为响应快速发展新质生产力的号召,细胞工厂需要快速更新迭代以适应不同的生产环境,以及追求更高的生产性能,这对细胞工厂的精准设计、快速迭代、发酵过程控制等提出了极高的要求。而随着计算领域的发展,“数字孪生”(digital twin)实现了对化工过程优化与控制、新产品开发与测试等的数字化[2],人工智能更拓展并提高了数字孪生的应用范围和效果[3]。基于类似的想法,对细胞内复杂的生物过程进行数字化模型构建,构建多种数据库,并利用机器学习等手段对酶、细胞工厂代谢网络、发酵工艺等进行数字化,形成细胞工厂全生命周期数字化设计方法(图 1)。利用这些方法,可以快速、高效获得高性能细胞工厂,赋能绿色生物制造。
![]() |
图 1 细胞工厂全生命周期数字化设计 Figure 1 Entire life-cycle digital design of cell factories |
数据是数字化的基础。在细胞工厂中,由酶催化的代谢反应是实现细胞生长、产物合成的关键。代谢数据库包含代谢化合物、生化反应、催化生化反应的酶、代谢反应组合形成的代谢途径等信息,是代谢网络数字化的基础。
1.1 代谢数据库、酶数据库的发展现状近年来,随着互联网时代的来临,酶、代谢数据的共享为研究人员带来了极大的便利(表 1)。KEGG、MetaCyc(BioCyc数据库子数据库)等常用的综合代谢数据库在分子水平建立了对细胞代谢的系统认知,Brenda、PDB、Uniprot等酶反应数据库则聚焦代谢反应酶的结构与功能。代谢数据库和酶数据库的结合,将由代谢途径组成的代谢网络,与酶结构功能、催化活性、细胞定位等的酶催化数据相结合,形成对细胞工厂代谢的系统性表征。同时,随着研究的深入,HMDB(人类代谢组数据库)、SGD(酵母基因组数据库)、GMD(植物代谢组数据库)等物种专有代谢数据库、基因数据库,在特定的应用环境中也发挥了重要作用。
![]() |
我国在发展和建设自主知识产权的高质量代谢、酶数据库方面发展较晚,导致我国在绿色生物制造产业发展安全及在国际上的核心竞争力存在一定程度的隐患。为此,近年来国家和研究人员开始重视生物科学数据的标准化及安全管理,颁布了《中华人民共和国生物安全法》,同时依托《中华人民共和国数据安全法》等法律法规,推进生物科学数据的标准化数据库构建与规范化管理[4]。
1.2 基于大语言模型的数据库更新方法随着合成生物技术的发展,细胞中新酶、代谢反应的更新速度呈指数级增长[5],传统数据库更新及维护需要人工对信息进行整理,存在一定滞后性。随着计算机技术的发展,通过机器学习挖掘文献中文本提取代谢相关信息成为可能[6],而近几年GPT-4、Bard等大语言模型(LLM)在生物医药领域的发展与应用[7],更是提高了生物代谢信息提取的速度与准确性[8]。而在部分文献中,代谢途径信息以图片格式展示,为提取这部分不在文本中的代谢数据信息,在最新的报道中,研究人员使用包括Faster R-CNN和PaddleOCR的机器学习模型对文献中包含代谢途径的图片进行识别,实现了高通量、全面地从文献中提取代谢反应信息[9]。随着机器读文献中信息获取能力和准确性的提升,代谢数据库、酶数据库的数据更新将更具时效性。
2 细胞工厂酶的数字化设计酶是细胞中代谢反应的核心,酶的功能、活性、选择性直接影响细胞工厂的产物合成能力。酶的数字化设计为细胞工厂中代谢反应提供了高效的催化剂。通过数字化方法,预测蛋白质结构与功能,并进行酶的改造设计,可将酶的催化活性提高数百甚至上千倍。例如,通过理论计算-实验验证,ω-转胺酶的kcat/Km值提高了1 660倍[10]。
2.1 蛋白质结构预测蛋白质结构是其功能的基础,数字化酶的设计依赖于蛋白质结构的精准预测。根据不同的预测思路,研究人员开发了多种蛋白质结构预测软件,包括基于同源建模的SWISS-MODEL[11, 12]、基于无模板方法的Rosetta[13]等。而Google DeepMind团队基于深度学习算法开发的Alphafold在精准预测蛋白质结构的基础上,更提高了蛋白质、核酸、小分子、离子间互作结构的预测准确性[14],将生物大分子结构预测推上了新高度。
2.2 细胞工厂酶的改造——酶的再设计酶的再设计根据已有酶的结构功能,对催化活性中心或其他关键位点氨基酸进行突变,并通过量子力学模拟(QM)、分子动力学模拟(MD)、粗粒化(CG)模拟、分子对接等计算生物化学手段进行分析,并指导湿实验验证,实现以催化活性提高或耐受能力提高等为目标的快速酶设计。
2.3 细胞工厂酶的创新——酶的从头设计蛋白质结构决定功能,而理论上蛋白质的氨基酸序列决定蛋白质结构,已知功能酶的量级远远小于由随机氨基酸序列组成的“蛋白质空间”。相比于酶的再设计,酶的从头设计旨在结合已有酶骨架结构及功能特点,拓展已知功能酶在蛋白质空间中的范围,实现新功能酶的设计,探索浩瀚未知的蛋白质空间。限于酶从头设计的难度,现阶段高性能软件及成功案例相对较少,包括ORBIT[15, 16]、DESIGNER[17]、Rosetta[13]、CCBuilder[18]、PRODA[19]等在内的多种软件能够实现酶的从头设计。其中Rosetta针对自然界中没有酶可以催化的化学反应,如Kemp消除反应[20]、逆醛缩反应[21]等,进行酶的从头设计,创造了可以催化这些反应的人工设计酶,拓展了酶可催化反应的种类,Rosetta的开发者David Baker也因在计算蛋白领域的贡献获得2024年诺贝尔化学奖。
3 细胞工厂代谢网络数字化设计酶的数字化实现了酶催化代谢反应的优化及新功能酶的设计,拓展了以酶催化反应为核心的细胞工厂的功能。在细胞工厂的代谢层面,细胞内源的酶促反应会组成复杂的代谢网络,而通过合成生物学添加的外源路径更增加了细胞工厂设计的难度。为实现目标产物的高效合成,在细胞工厂中,需要对复杂代谢网络中物质流、能量流、异源合成路径等进行组织优化,这通常需要耗费大量的物力和时间成本。基因组尺度代谢网络模型(GEM)、生物逆合成途径预测、基因线路数字化设计等数字化方法可以指导细胞工厂的设计,减少试错成本(图 2)。
![]() |
图 2 细胞工厂代谢网络数字化设计 Figure 2 Digital design of cell factories containing metabolic networks |
GEM将代谢网络数字化,以描述生物体整个代谢途径中基因—蛋白质—代谢反应的关系特征,是通过数学模型模拟细胞内代谢反应的系统生物学研究方法[22]。自研究人员首次在流感嗜血杆菌[23]中完成了GEM的构建与应用,在接下来的20余年中,为提高GEM计算的准确性,在以代谢流矩阵为核心的代谢流平衡分析(FBA)基本算法的基础上,添加了酶约束[24-26]、热力学约束[27, 28]及多约束[29]等不同层次的附加约束,并结合转录组学、代谢组学[30, 31]等实验数据,实现了多种生物高质量GEM的构建与应用[32, 33]。而随着获取实验数据成本降低、数据更新速度加快,GEM也在不断地更新重构,以适应不同的应用环境。
GEM的模型构建方法主要包括:手动构建、自动构建和半自动构建[22]。2010年COBRA ToolBox[34]工具箱的开发实现了GEM手动构建的数字化,但手动构建需要耗费大量的时间。自动与半自动工具加快了GEM模型的构建,自动构建GEM,如Model SEED[35]等工具箱可以快速大批量生成多个物种的GEM,但数据质量很大程度影响自动构建的GEM模型的精准度。而半自动构建GEM的工具既可以快速收集数据,又可以进行手动数据校正,保证了快速构建的模型的精准性,成为现阶段GEM构建与重构的主要方法。现阶段半自动构建模型的方法逐渐成熟并趋于标准化,已有多种工具箱被开发使用:RAVEN工具可以重构和分析GEM[36],并将结果进行可视化;Merlin集成了序列匹配与亚细胞定位功能,使得其使用极为方便[37];GECKO工具通过动力学和分子生物学数据向GEM中添加酶制约因素[38],从而提高GEM预测能力。
利用构建的模型,通过FBA算法计算细胞内代谢流量,预测细胞以最大化生长或生产产物为目标的代谢通量,进而为理解细胞内的代谢流量变化提供帮助[39];而MOMA[40]、FSEOF[41]及OptKnock[42]等算法则以提高生长与生产为目标,预测细胞代谢通量分布,并提供基因表达强度优化策略,为细胞工厂实验设计提供指导。
随着数据更新速度的加快及模型构建技术的更新,研究人员实现了对多种工业微生物GEM的重构与迭代[43],并应用这些GEM实现了工业细胞工厂代谢网络的数字化设计(表 2)。
在进行全新化合物或从未在细胞工厂中完成从头合成的化合物的细胞工厂构建过程中,需要大量的时间精力进行未知途径的解析及途径设计,且这个过程强烈依赖专家知识。数字细胞工厂通过生物逆合成策略,结合数据库中数据信息,针对目标分子,通过反应规则、机器学习等方法,利用酶的杂泛性拓展酶催化反应空间,将目标分子复杂结构逆向解析,以细胞工厂内源代谢物为逆合成目标终点,实现细胞工厂外源代谢途径的逆合成设计。逆合成设计结合上述章节中介绍的酶的从头设计、再设计,及细胞工厂代谢网络数字化设计,形成完整的目标分子细胞工厂代谢途径设计。
生物逆合成在目标分子异源合成途径设计中,根据原理和实现难易程度,可以分为2类[53]:①基于已知酶、代谢反应的知识库搜索方法;②基于反应规则提取或机器学习,预测未知的、新的酶促反应的方法。这2种方法可以进行组合,实现更贴合实验设计思路的逆合成路径设计。
基于知识库搜索的途径设计方法由于无法超越数据库中数据,受限于已知酶促反应的数据规模。通过蒙特卡洛树搜索(MCTS)、无环路径搜索等算法,构建了DESHARKY[54]、Metabolic tinker[55]等软件,实现了基于已知酶促反应的逆合成途径设计,成功发现碳利用率、能量利用率更高的新途径,并应用在细胞工厂构建中[56, 57]。
在新酶促代谢反应预测方面,按拓展新酶促反应的方法可分为:基于反应规则的逆合成设计方法、无模板逆合成设计方法、半模板逆合成设计方法[58]。
基于反应规则的逆合成设计通过原子—原子映射等方法从已知数据库中提取反应规则,并使用标准化方法形成反应规则数据库。例如,RetroRules[59]、Ni[60]等从MetaCyc数据库抽提并精简的包含1 224条反应规则的规则数据库;RetroBioCat软件使用的包含99条的极简反应规则数据库[61]等;通过MCTS等算法构建逆合成途径设计软件,基于RetroRules的RetroPath2.0[59]、RetroPath RL[62]、RetroBioCat[61]等。
无模板逆合成设计方法使用反应数据库来训练机器学习模型,将“反应物—产物信息对”视为翻译过程,使用自然语言处理(NLP)进行模型构建,实现逆合成反应途径的拓展,基于此方法已开发了BioNavi-NP[63]、基于酶EC号的预测模型[64]等算法或软件。
基于反应规则的逆合成设计结果中,通过反应数据库—反应规则数据库的映射关系可以提供预测途径的酶参考信息,可以基于已有信息进行酶的数字化设计,但设计的途径受限于反应规则数据库。而无模板逆合成设计方法通过机器学习,极大拓展了酶促反应空间,但由于酶促反应数据量对于机器学习而言仍然较小,其准确性仍有待提高。而基于深度学习开发的半模板逆合成设计软件,如RetroPrime[65]、G2Retro[66]则通过分子图捕捉分子结构特征,解决了无模板方法中已有SMILES式为唯一输入使得模型无法理解分子结构信息的问题。半模板方法通过预测反应中心提高了模型的可解释性,并通过深度学习保证了逆合成预测的拓展能力和多样性。
3.3 基因线路数字化设计调控基因时序表达为了满足细胞工厂基因表达的时序调控、不同代谢模块之间的代谢通量调节等需求,需要进行基因的逻辑、时序、定量表达调控、多基因同时表达调控等逻辑门基因线路设计。完成这些设计需要使用诱导型启动子、基于特定DNA序列靶向蛋白的启动子抑制、转录因子等转录调控工具[67]。面对多基因的逻辑构建等复杂问题,手动设计时间成本高、准确性低[68],而基因线路自动化设计(GDA)可以快速将标准化基因元件组装和设计成具有所需功能的基因线路。
GDA基于标准化元件库,实现基因线路的数字化设计。研究人员使用合成生物学开放语言(SBOL)[69]、系统生物学标记语言(SBML)[70]等方法构建了SynBioHub[71]、Addgene[72]、iGEM[73]等标准化基因元件数据库。基于这些数据库,开发了SBOLCanvas[74]、iBioSim[75]、Cello[76]、SynBioSuite[77]等GDA软件,实现基因线路快速精准数字化设计,其中Cello软件的基因线路设计在大肠杆菌[76]、酵母菌[78]、多形拟杆菌[79]等细胞工厂中已有广泛的应用。
4 细胞工厂发酵工艺与过程数字化获得高性能细胞工厂后,为使其能够实现目标产物工业规模发酵生产,需要将发酵体系逐级放大以优化发酵工艺与过程参数,实现产品的高效生产。面对生物发酵体系复杂、缺乏有效传感器、测样频率低、检测时间长导致时效性差等一系列问题[80],工业级发酵过程的数字孪生与优化控制有助于发酵体系的控制和产量的提高(图 3)。
![]() |
图 3 细胞工厂发酵工艺与过程数字化 Figure 3 Digital design of cell factories for fermentation processes |
在发酵工艺的设计过程中,放大效应的存在致使工艺设计与实际工业生产环境不匹配,影响细胞工厂合成效率。通过数字孪生,及其与知识图谱结合等数字化手段,可对发酵过程进行数字化模拟及实时监控,并对发酵过程进行自动化控制,实现发酵工艺的优化。
在发酵工艺中,数字孪生通过接受发酵过程产生的实时数据,如发酵体系溶氧(DO)[81, 82]、尾气分析[82-84]、温度等,进行仿真、预测,分析发酵状态,并根据发酵状态对发酵体系进行优化和决策[85]。通过人工智能,结合实际发酵体系,可以实现中试级别[86]、生产级别发酵体系[87, 88]的数字孪生模型构建,并实现产物产量的提高。将基于关键因素间关系专家知识的知识图谱方法与数字孪生结合,构建两种方法的整合决策模型,可以提高预测准确性并增强控制性能[89, 90]。
4.2 发酵车间数字化管理系统设计在工业生产中,设备、原料、人力等资源的时空调度同样是保证发酵工艺过程、工业生产效率的重要因素。在“工业4.0”的概念基础下,对工业生产过程进行信息化建设,构建企业资源计划(ERP)系统[91],并结合自动化系统,开发了制造执行系统(MES)[92, 93],实现数据实时采集、管理,并进行资源、设备的调度,构建发酵车间层次的管理数字化软件[94],实现了发酵过程成本降低及生产效率的提高。
5 数字细胞工厂总结与展望基于人工智能、模型构建等的数字化方法已经在细胞工厂构建的全流程中得到了广泛的应用。相比传统细胞工厂设计方法,数字化设计具有高效、节约成本等优势。在以细胞工厂为核心的绿色生物制造高速发展的背景下,细胞工厂设计数字化进程正在不断加快,形成了包括数据库构建、细胞工厂代谢设计、发酵体系设计、发酵过程调控等的细胞工厂全生命周期数字化设计(图 1)。随着未来计算能力的提升及更深入的学科交叉,全生命周期数字化细胞工厂设计将向更准确、更快速、更高效、全流程的方向发展,赋能绿色生物制造。
[1] |
谭天伟, 苏海佳, 陈必强, 等. 绿色生物制造. 北京化工大学学报(自然科学版), 2018, 45(5): 107-118. Tan T W, Su H J, Chen B Q, et al. Green bio-manufacturing. Journal of Beijing University of Chemical Technology (Natural Science Edition), 2018, 45(5): 107-118. (in Chinese) |
[2] |
陈岳飞, 肖珍芳, 方向. 数字孪生技术及其在石油化工行业的应用. 天然气化工(C1化学与化工), 2021, 46(2): 25-30. Chen Y F, Xiao Z F, Fang X. Digital twin technology and its application in petrochemical industry. Natural Gas Chemical Industry, 2021, 46(2): 25-30. (in Chinese) |
[3] |
Rathore M M, Shah S A, Shukla D, et al. The role of AI, machine learning, and big data in digital twinning: A systematic literature review, challenges, and opportunities. IEEE Access, 2021, 9: 32030-32052. DOI:10.1109/ACCESS.2021.3060863 |
[4] |
徐玄, 于连超, 任思源. 美国生物数据战略发展态势及启示. 科技管理研究, 2024, 44(5): 40-46. Xu X, Yu L C, Ren S Y. Development trends and implications of the United States'biological data strategy. Science and Technology Management Research, 2024, 44(5): 40-46. (in Chinese) |
[5] |
Prešern U, Goličnik M. Enzyme databases in the era of omics and artificial intelligence. International Journal of Molecular Sciences, 2023, 24(23): 16918. DOI:10.3390/ijms242316918 |
[6] |
Zhao S D, Su C, Lu Z Y, et al. Recent advances in biomedical literature mining. Briefings in Bioinformatics, 2021, 22(3): bbaa057. DOI:10.1093/bib/bbaa057 |
[7] |
Thapa S, Adhikari S. ChatGPT, bard, and large language models for biomedical research: Opportunities and pitfalls. Annals of Biomedical Engineering, 2023, 51(12): 2647-2651. DOI:10.1007/s10439-023-03284-0 |
[8] |
Shamsabadi M, D'Souza J, Auer S. Large language models for scientific information extraction: An empirical study for virology. arXiv, 2024. |
[9] |
Kwon M S, Lee J, Kim H U. A machine learning framework for extracting information from biological pathway images in the literature. Metabolic Engineering, 2024, 86: 1-11. DOI:10.1016/j.ymben.2024.09.001 |
[10] |
Yang L, Zhang K Y, Xu M, et al. Mechanism-guided computational design of ω-transaminase by reprograming of high-energy-barrier steps. Angewandte Chemie (International Ed), 2022, 61(52): e202212555. DOI:10.1002/anie.202212555 |
[11] |
Bienert S, Waterhouse A, de Beer T A P, et al. The SWISSMODEL Repository-new features and functionality. Nucleic Acids Research, 2017, 45(D1): 313-319. DOI:10.1093/nar/gkw1132 |
[12] |
Guex N, Peitsch M C. SWISS-MODEL and the SwissPdbViewer: An environment for comparative protein modeling. Electrophoresis, 1997, 18(15): 2714-2723. DOI:10.1002/elps.1150181505 |
[13] |
Leaver-Fay A, Tyka M, Lewis S M, et al. ROSETTA3: An object-oriented software suite for the simulation and design of macromolecules. Methods in Enzymology, 2011, 487: 545-574. |
[14] |
Abramson J, Adler J, Dunger J, et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature, 2024, 630: 493-500. DOI:10.1038/s41586-024-07487-w |
[15] |
Bolon D N, Mayo S L. Enzyme-like proteins by computational design. PNAS, 2001, 98(25): 14274-14279. DOI:10.1073/pnas.251555398 |
[16] |
Privett H K, Kiss G, Lee T M, et al. Iterative approach to computational enzyme design. PNAS, 2012, 109(10): 3790-3795. DOI:10.1073/pnas.1118082108 |
[17] |
Suarez M, Tortosa P, Garcia-Mira M M, et al. Using multiobjective computational design to extend protein promiscuity. Biophysical Chemistry, 2010, 147(1-2): 13-19. DOI:10.1016/j.bpc.2009.12.003 |
[18] |
Burton A J, Thomson A R, Dawson W M, et al. Installing hydrolytic activity into a completely de novo protein framework. Nature Chemistry, 2016, 8(9): 837-844. DOI:10.1038/nchem.2555 |
[19] |
Wang P Y, Zhang J, Zhang S Y, et al. Using high-throughput molecular dynamics simulation to enhance the computational design of kemp elimination enzymes. Journal of Chemical Information and Modeling, 2023, 63(4): 1323-1337. DOI:10.1021/acs.jcim.3c00002 |
[20] |
Röthlisberger D, Khersonsky O, Wollacott A M, et al. Kemp elimination catalysts by computational enzyme design. Nature, 2008, 453: 190-195. DOI:10.1038/nature06879 |
[21] |
Jiang L, Althoff E A, Clemente F R, et al. De novo computational design of retro-aldol enzymes. Science, 2008, 319: 1387-1391. DOI:10.1126/science.1152692 |
[22] |
Qian J Y, Ye C. Chapter One Development and applications of genome-scale metabolic network models. Advances in Applied Microbiology, 2024, 126: 1-26. |
[23] |
Jason A P, Nathan D P, Jeremy S E, et al. The genome-scale metabolic extreme pathway structure in Haemophilus influenzae shows significant network redundancy. Journal of Theoretical Biology, 2002, 215(1): 67-82. DOI:10.1006/jtbi.2001.2499 |
[24] |
Adadi R, Volkmer B, Milo R, et al. Prediction of microbial growth rate versus biomass yield by a metabolic network with kinetic parameters. PLoS Computational Biology, 2012, 8(7): e1002575. DOI:10.1371/journal.pcbi.1002575 |
[25] |
Lerman J A, Hyduke D R, Latif H, et al. In silico method for modelling metabolism and gene product expression at genome scale. Nature Communications, 2012, 3: 929. DOI:10.1038/ncomms1928 |
[26] |
Basan M, Hui S, Okano H, et al. Overflow metabolism in Escherichia coli results from efficient proteome allocation. Nature, 2015, 528: 99-104. DOI:10.1038/nature15765 |
[27] |
Henry C S, Broadbelt L J, Hatzimanikatis V. Thermodynamics-based metabolic flux analysis. Biophysical Journal, 2007, 92(5): 1792-1805. DOI:10.1529/biophysj.106.093138 |
[28] |
Soh K C, Hatzimanikatis V. Network thermodynamics in the post-genomic era. Current Opinion in Microbiology, 2010, 13(3): 350-357. DOI:10.1016/j.mib.2010.03.001 |
[29] |
Yang X, Mao Z T, Zhao X, et al. Integrating thermodynamic and enzymatic constraints into genome-scale metabolic models. Metabolic Engineering, 2021, 67: 133-144. DOI:10.1016/j.ymben.2021.06.005 |
[30] |
Wyrick J J, Young R A. Deciphering gene expression regulatory networks. Current Opinion in Genetics & Development, 2002, 12(2): 130-136. |
[31] |
Herrgård M J, Covert M W, Palsson B Ø. Reconstruction of microbial transcriptional regulatory networks. Current Opinion in Biotechnology, 2004, 15(1): 70-77. DOI:10.1016/j.copbio.2003.11.002 |
[32] |
Lu J G, Bi X Y, Liu Y F, et al. In silico cell factory design driven by comprehensive genome-scale metabolic models: Development and challenges. Systems Microbiology and Biomanufacturing, 2023, 3(2): 207-222. DOI:10.1007/s43393-022-00117-4 |
[33] |
杨雪, 张培基, 毛志涛, 等. 多约束代谢网络模型的研究进展. 生物工程学报, 2022, 38(2): 531-545. Yang X, Zhang P J, Mao Z T, et al. Development of metabolic models with multiple constraints: A review. Chinese Journal of Biotechnology, 2022, 38(2): 531-545. (in Chinese) |
[34] |
Heirendt L, Arreckx S, Pfau T, et al. Creation and analysis of biochemical constraint-based models using the COBRA Toolbox v.3.0. Nature Protocols, 2019, 14(3): 639-702. DOI:10.1038/s41596-018-0098-2 |
[35] |
Henry C S, DeJongh M, Best A A, et al. High-throughput generation, optimization and analysis of genome-scale metabolic models. Nature Biotechnology, 2010, 28(9): 977-982. DOI:10.1038/nbt.1672 |
[36] |
Agren R, Liu L M, Shoaie S, et al. The RAVEN toolbox and its use for generating a genome-scale metabolic model for Penicillium chrysogenum. PLoS Computational Biology, 2013, 9(3): e1002980. DOI:10.1371/journal.pcbi.1002980 |
[37] |
Capela J, Lagoa D, Rodrigues R, et al. Merlin, an improved framework for the reconstruction of high-quality genomescale metabolic models. Nucleic Acids Research, 2022, 50(11): 6052-6066. DOI:10.1093/nar/gkac459 |
[38] |
Chen Y, Gustafsson J, Tafur Rangel A, et al. Reconstruction, simulation and analysis of enzyme-constrained metabolic models using GECKO Toolbox 3.0. Nature Protocols, 2024, 19(3): 629-667. |
[39] |
Savinell J M, Palsson B O. Network analysis of intermediary metabolism using linear optimization. Journal of Theoretical Biology, 1992, 154(4): 455-473. |
[40] |
Qian J Y, Wang Y Z, Liu X E, et al. Improving acetoin production through construction of a genome-scale metabolic model. Computers in Biology and Medicine, 2023, 158: 106833. |
[41] |
Kim M, Yi J S, Kim J, et al. Reconstruction of a high-quality metabolic model enables the identification of gene overexpression targets for enhanced antibiotic production in Streptomyces coelicolor A3(2). Biotechnology Journal, 2014, 9(9): 1185-1194. |
[42] |
Burgard A P, Pharkya P, Maranas C D. Optknock: A bilevel programming framework for identifying gene knockout strategies for microbial strain optimization. Biotechnology and Bioengineering, 2003, 84(6): 647-657. |
[43] |
Gong Z J, Chen J Y, Jiao X Y, et al. Genome-scale metabolic network models for industrial microorganisms metabolic engineering: Current advances and future prospects. Biotechnology Advances, 2024, 72: 108319. |
[44] |
Monk J M, Lloyd C J, Brunk E, et al. iML1515, a knowledgebase that computes Escherichia coli traits. Nature Biotechnology, 2017, 35(10): 904-908. |
[45] |
Ye C, Luo Q L, Guo L, et al. Improving lysine production through construction of an Escherichia coli enzymeconstrained model. Biotechnology and Bioengineering, 2020, 117(11): 3533-3544. |
[46] |
Yang X, Mao Z T, Zhao X, et al. Integrating thermodynamic and enzymatic constraints into genome-scale metabolic models. Metabolic Engineering, 2021, 67: 133-144. |
[47] |
Zhang C Y, Sánchez B J, Li F R, et al. Yeast9: A consensus genome-scale metabolic model for S. cerevisiae curated by the community. Molecular Systems Biology, 2024, 20(10): 1134-1150. |
[48] |
Ishchuk O P, Domenzain I, Sánchez B J, et al. Genome-scale modeling drives 70-fold improvement of intracellular heme production in Saccharomyces cerevisiae. PNAS, 2022, 119(30). |
[49] |
Bi X Y, Cheng Y, Xu X H, et al. etiBsu1209: A comprehensive multiscale metabolic model for Bacillus subtilis. Biotechnology and Bioengineering, 2023, 120(6): 1623-1639. |
[50] |
Bi X Y, Cheng Y, Lv X Q, et al. A multi-omics, machine learning-aware, genome-wide metabolic model of Bacillus subtilis refines the gene expression and cell growth prediction. Advanced Science, 2024, 11(42): e2408705. |
[51] |
Feierabend M, Renz A, Zelle E, et al. High-quality genomescale reconstruction of Corynebacterium glutamicum ATCC 13032. Frontiers in Microbiology, 2021, 12: 750206. |
[52] |
Niu J H, Mao Z T, Mao Y F, et al. Construction and analysis of an enzyme-constrained metabolic model of Corynebacterium glutamicum. Biomolecules, 2022, 12(10): 1499. |
[53] |
张震, 曾雪城, 秦磊, 等. 微生物细胞工厂的智能设计进展. 化工学报, 2021, 72(12): 6093-6108. Zhang Z, Zeng X C, Qin L, et al. Intelligent design of microbial cell factory. CIESC Journal, 2021, 72(12): 6093-6108. (in Chinese) |
[54] |
Rodrigo G, Carrera J, Prather K J, et al. DESHARKY: Automatic design of metabolic pathways for optimal cell growth. Bioinformatics, 2008, 24(21): 2554-2556. |
[55] |
McClymont K, Soyer O S. Metabolic tinker: An online tool for guiding the design of synthetic metabolic pathways. Nucleic Acids Research, 2013, 41(11): e113. |
[56] |
Tan Z G, Clomburg J M, Cheong S, et al. A polyketoacylCoA thiolase-dependent pathway for the synthesis of polyketide backbones. Nature Catalysis, 2020, 3: 593-603. |
[57] |
Clomburg J M, Qian S, Tan Z G, et al. The isoprenoid alcohol pathway, a synthetic route for isoprenoid biosynthesis. PNAS, 2019, 116(26): 12810-12815. |
[58] |
Tan Z G, Li J, Hou J, et al. Designing artificial pathways for improving chemical production. Biotechnology Advances, 2023, 64: 108119. |
[59] |
Delépine B, Duigou T, Carbonell P, et al. RetroPath2.0: A retrosynthesis workflow for metabolic engineers. Metabolic Engineering, 2018, 45: 158-170. |
[60] |
Ni Z F, Stine A E, Tyo K E J, et al. Curating a comprehensive set of enzymatic reaction rules for efficient novel biosynthetic pathway design. Metabolic Engineering, 2021, 65: 79-87. |
[61] |
Finnigan W, Hepworth L J, Flitsch S L, et al. RetroBioCat as a computer-aided synthesis planning tool for biocatalytic reactions and cascades. Nature Catalysis, 2021, 4(2): 98-104. |
[62] |
Koch M, Duigou T, Faulon J L. Reinforcement learning for bioretrosynthesis. ACS Synthetic Biology, 2020, 9(1): 157-168. |
[63] |
Zheng S J, Zeng T, Li C T, et al. Deep learning driven biosynthetic pathways navigation for natural products with BioNavi-NP. Nature Communications, 2022, 13(1): 3342. |
[64] |
Probst D, Manica M, Nana Teukam Y G, et al. Biocatalysed synthesis planning using data-driven learning. Nature Communications, 2022, 13(1): 964. |
[65] |
Wang X R, Li Y Q, Qiu J Z, et al. RetroPrime: A Diverse, plausible and Transformer-based method for Single-Step retrosynthesis predictions. Chemical Engineering Journal, 2021, 420: 129845. |
[66] |
Chen Z Q, Ayinde O R, Fuchs J R, et al. G2Retro as a twostep graph generative models for retrosynthesis prediction. Communications Chemistry, 2023, 6(1): 102. |
[67] |
Chan C T Y, Kennedy V, Kinshuk S. A domain swapping strategy to create modular transcriptional regulators for novel topology in genetic network. Biotechnology Advances, 2024, 72: 108345. |
[68] |
Xu X H, Lv X Q, Bi X Y, et al. Genetic circuits for metabolic flux optimization. Trends in Microbiology, 2024, 32(8): 791-806. |
[69] |
Myers C, Clancy K, Misirli G, et al. The synthetic biology open language. Methods in Molecular Biology, 2015, 1244: 323-336. |
[70] |
Keating S M, Waltemath D, König M, et al. SBML Level 3: An extensible format for the exchange and reuse of biological models. Molecular Systems Biology, 2020, 16(8): e9110. |
[71] |
McLaughlin J A, Myers C J, Zundel Z, et al. SynBioHub: A standards-enabled design repository for synthetic biology. ACS Synthetic Biology, 2018, 7(2): 682-688. |
[72] |
Kamens J. The Addgene repository: An international nonprofit plasmid and data resource. Nucleic Acids Research, 2015, 43: D1152-D1157. |
[73] |
Vilanova C, Porcar M. iGEM 2.0—Refoundations for engineering biology. Nature Biotechnology, 2014, 32(5): 420-424. |
[74] |
Terry L, Earl J, Thayer S, et al. SBOLCanvas: A visual editor for genetic designs. ACS Synthetic Biology, 2021, 10(7): 1792-1796. |
[75] |
Buecherl L, Roberts R, Fontanarrosa P, et al. Stochastic hazard analysis of genetic circuits in iBioSim and STAMINA. ACS Synthetic Biology, 2021, 10(10): 2532-2540. |
[76] |
Jones T S, Oliveira S M D, Myers C J, et al. Genetic circuit design automation with cello 2.0. Nature Protocols, 2022, 17(4): 1097-1113. |
[77] |
Sents Z, Stoughton T E, Buecherl L, et al. SynBioSuite: A tool for improving the workflow for genetic design and modeling. ACS Synthetic Biology, 2023, 12(3): 892-897. |
[78] |
Chen Y, Zhang S Y, Young E M, et al. Genetic circuit design automation for yeast. Nature Microbiology, 2020, 5(11): 1349-1360. |
[79] |
Taketani M, Zhang J B, Zhang S Y, et al. Genetic circuit design automation for the gut resident species Bacteroides thetaiotaomicron. Nature Biotechnology, 2020, 38(8): 962-969. |
[80] |
Shah P, Sheriff M Z, Bangi M S F, et al. Multi-rate observer design and optimal control to maximize productivity of an industry-scale fermentation process. AIChE Journal, 2023, 69(2): e17946. |
[81] |
Wang G, Haringa C, Noorman H, et al. Developing a computational framework to advance bioprocess scale-up. Trends in Biotechnology, 2020, 38(8): 846-856. |
[82] |
Li X Y, Yu C, Yao J M, et al. An online respiratory quotientfeedback strategy of feeding yeast extract for efficient arachidonic acid production by Mortierella alpina. Frontiers in Bioengineering and Biotechnology, 2018, 5: 83. |
[83] |
Zou X, Xia J Y, Chu J, et al. Real-time fluid dynamics investigation and physiological response for erythromycin fermentation scale-up from 50 L to 132 m3 fermenter. Bioprocess and Biosystems Engineering, 2012, 35(5): 789-800. |
[84] |
Li X, Huang C, Xu C Q, et al. High cell density culture of baker's yeast FX-2 based on pH-stat coupling with respiratory quotient. Biotechnology and Applied Biochemistry, 2019, 66(3): 389-397. |
[85] |
Udugama I A, Lopez P C, Gargalo C L, et al. Digital Twin in biomanufacturing: Challenges and opportunities towards its implementation. Systems Microbiology and Biomanufacturing, 2021, 1(3): 257-274. |
[86] |
Markarian J. Opportunities for digital twins. Biopharm International, 2021, 34(9): 30-33. |
[87] |
Haringa C, Tang W J, Wang G, et al. Computational fluid dynamics simulation of an industrial P. chrysogenum fermentation with a coupled 9-pool metabolic model: Towards rational scale-down and design optimization. Chemical Engineering Science, 2018, 175: 12-24. |
[88] |
Bandala M, Chard P, Cockbain N, et al. Digital twin challenges and opportunities for nuclear fuel manufacturing applications. Nuclear Engineering and Design, 2024, 420: 113013. |
[89] |
Sahlab N, Kamm S, Muller T, et al. Knowledge graphs as enhancers of intelligent digital twins//2021 4th IEEE International Conference on Industrial Cyber-Physical Systems (ICPS). New York: IEEE, 2021: 19-24.
|
[90] |
Banerjee A, Dalal R, Mittal S, et al. Generating digital twin models using knowledge graphs for industrial production lines. Proceedings of the 2017 ACM on Web Science Conference, 2017. DOI:10.1145/3091478.3162383 |
[91] |
Jensen K M, MacDonald J A. Towards thoughtful planning of ERP studies: How participants, trials, and effect magnitude interact to influence statistical power across seven ERP components. Psychophysiology, 2023, 60(7): e14245.. |
[92] |
Zwolińska B, Tubis A A, Chamier-Gliszczyński N, et al. Personalization of the MES system to the needs of highly variable production. Sensors, 2020, 20(22): 6484. |
[93] |
Kong W F, Huang L P, Quan X, et al. Synergistic induced charge transfer switch by oxygen vacancy and pyrrolic nitrogen in MnFe2O4/g-C3N4 heterojunctions for efficient transformation of bicarbonate to acetate in photo-assisted MES. Applied Catalysis B: Environment and Energy, 2022, 307: 121214. |
[94] |
刘思逸. 发酵车间的数字化生产管理系统研发. 杭州: 杭州电子科技大学, 2023. Liu S Y. Development of a Digital Production Management System for Fermentation Workshops. Hangzhou: Hangzhou Dianzi University, 2023. (in Chinese) |