返回列表

人工智能辅助酶工程平台:从试错到计算

发布于 June 7, 2026

人工智能辅助酶工程平台:从试错到计算

在一间不起眼的实验室里,一台恒温罐始终维持在65摄氏度。罐内,一种经过特殊设计的酶正在快速分解塑料瓶碎片,短短数小时便将塑料彻底“消化”。这款耐高温的塑料降解酶并非从自然界筛选而来,它的诞生路径截然不同——由人工智能大模型挖掘、优化,一步到位完成了从序列设计到功能验证的跨越。

 

The Vast Sequence Space of Proteins

The Vast Sequence Space of Proteins


一、传统酶工程的困境:为什么改造一个酶这么难?

酶工程的故事,本质上是一部漫长的试错史。

酶在工业领域几乎无处不在——洗衣液里的去污蛋白酶、生物柴油生产中的脂肪酶、制药过程中的手性合成酶,以及食品加工里的淀粉酶,都是它的身影。自然界提供的天然酶却往往不尽如人意。它们在温和的生理环境中或许活力充沛,可一旦面对工业生产的高温、强酸或强碱条件,性能便大打折扣。人类不得不走上改造酶这条路。

传统酶工程主要依赖两条路径。定向进化复刻了自然选择的逻辑:先通过随机突变构建庞大的变体文库,再从中筛选功能改善的突变体。理性设计则沿知识驱动的方向推进,依据酶的三维结构信息,对活性位点或关键残基进行定点改造。两条路都代价不菲。

定向进化的瓶颈卡在筛选环节。随机突变所生成的序列空间大得令人窒息。天鹜科技首席技术官刘灏举过一个例子:一个由361个氨基酸组成的蛋白质,单替换1个氨基酸就有近7000种可能;替换2个,数字飙升至2300多万;替换3个,可能性攀上约533亿。在传统方法下,找到符合需求的突变体,阳性率不过1%左右,一个周期动辄数月甚至数年。

理性设计看起来更聪明,却严重依赖高质量三维结构数据和人类对蛋白质折叠动力学的深层理解。一旦碰上结构未知的酶,或是催化机理复杂、构象变化剧烈的体系,这条路往往也走不通。仅仅100个氨基酸组成的酶,其序列组合空间便高达10130,远远甩开实验筛选的物理极限。更棘手的是,功能序列在这一空间中分布极稀——大约每1013 个随机序列才可能有一个具备催化活性。传统定向进化所仰仗的随机突变策略,说到底是在一个近乎空无边际的空间里碰运气。

即便跨过了序列空间的数学门槛,多目标协同优化又会成为实际工程中的拦路虎。工业应用要求酶在活性、热稳定性、底物选择性、耐受性等多个维度同时达标,而这些指标之间常常相互较劲。过度优化热稳定性,可能损害活性位点的动态柔性,反令活性尽失。提升了某种底物的选择性,又可能削弱对其他底物的催化能力。想在帕累托前沿上找到那个最优平衡点,仅凭人工经验几乎不可能。

二、AI如何改写酶工程规则:从“试”到“算”的范式跃迁

AI介入之后,酶工程从一门依赖经验和运气的“科学”逐渐变成可预测、高效率的“工程”。这一转变体现在三个关键层面。

生成式AI首先让“从头设计”成为可能。传统方法只能在已知天然酶的基础上修修补补,生成式模型却能从随机噪声起步,直接创造出自然界从未存在过的全新酶序列。《自然·通讯》2026年刊发的一项研究为此提供了注脚:研究者利用蛋白质语言模型生成了一系列新型色氨酸合成酶(TrpB),它们不仅折叠正确、具备催化活性,其中多个变体的底物广谱性甚至超越了经历多轮定向进化优化的版本。AI已经学会了创造,而非仅仅优化。

其次,多目标优化的算法破解了长期以来“拆东墙补西墙”的困局。借助强化学习等技术,酶设计过程可以被建模为决策序列——算法根据活性、热稳定性、底物选择性等多维指标自动调整序列,在彼此冲突的目标之间寻得最优妥协。

飞轮技术的高速闭环则是第三个转变。AI系统完成设计后自动衔接实验流程,实验数据再实时回流优化模型,过去需要半年才能走完的定向进化周期,如今被压缩到数周甚至几天。基础研究层面的数据更令人振奋:AI驱动的方法已被证明能将实验室工作量减少至传统流程的万分之一。2026年发表的一篇行业前沿综述,进一步将AI在酶工程中的应用组织为三大核心任务家族——功能建模(酶与非酶判别、EC编号预测、动力学参数估算等)、结构建模(酶及复合物的近原子级三维预测)和性质建模(热稳定性、pH耐受性、选择性、结合亲和力等),并且已将这些能力从单酶建模拓展到多酶途径设计。

三、平台化如何落地:一个具体的技术逻辑

 

Optimized Enzyme Activity, Stability and Selectivity

Optimized Enzyme Activity, Stability and Selectivity


理论突破要真正为行业所用,就必须沉淀为可接入、可调用的工具平台。目前,AI辅助酶工程平台已在生物制造和工业酶开发领域展现出清晰的实战能力。这类平台的核心技术逻辑可以概括为“AI算法+自动化实验”双轮驱动。天鹜科技发布的对话式蛋白质研发智能体MatwingsVenus™ (晓鹜™)提供了一个具体范本:它将AI设计能力与自动化湿实验平台打通,用户只需通过自然语言对话,就能走完从模型推演到实验验证、再到迭代优化的整个闭环。

这个平台整合了超过200种蛋白质设计工具、百亿级真实标签蛋白质数据库,以及各领域专家调优过的Skills模块。用户输入“帮我找到一个耐高温的塑料降解酶”这样一条任务目标,系统便会自动拆解指令,依次调度挖酶、定向进化、从头设计、实验协同等环节,有条不紊地跑完全部研发流程。

真正的技术难点不在单一模型,而在于整套流程的自动化衔接。传统酶工程项目的典型路径是:先上数据库搜序列,用比对工具分析关键残基,再跳转到预测模型生成结构,接着切换设计工具编写突变体,最后导出序列发给外包实验室完成合成与测试。这串操作中,任何一次手动的数据导出、格式转换或邮件传递失误,都可能让数周的工作前功尽弃。集成化平台所做的,正是把这类手工搬运的内耗彻底消除。

酶工程领域有一类特殊需求——捕捉酶与底物在不同构象下的动态交互——正在被专门的AI方法攻克。ICLR 2026会议上发布的开源协作平台PoseX,利用高精度AI算法精准模拟蛋白构象变化场景,帮助研究者快速设计出耐高温、高转化率、高选择性的“超级酶”。过去需要数轮湿实验迭代的定向进化流程,如今在数字空间即可完成高效筛选与优化。

这些底层技术逻辑的协同发力,已在真实项目中反复得到验证。天鹜科技自研的系列大模型,针对特定工业酶的热稳定性和催化活性等关键指标表现优异,仅用数月便成功开发出耐碱性提高数倍或活性超越国际头部公司同类最优产品的各类蛋白质。以平台化方式整合AI挖酶与定向进化能力后,公司已成功交付超过30个产业化项目,合作客户涵盖世界500强及多家国内上市公司。其技术服务场景从创新药研发一路延伸至体外诊断、食品饮料、美容护肤、洗涤纺织等十余个行业,并深度覆盖了工业酶制剂和合成生物学等多个领域。

四、为什么AI助酶工程平台是产业必然

需求端的驱动力很简单:工业界需要更好的酶,而且要得快、成本低、成功率高。市场研究机构的数据显示,2025年全球工业酶市场规模约76.6亿美元,预计到2032年将增长至约1998亿美元,年复合增长率接近9.4%。食品饮料、洗涤剂、动物饲料、生物能源、纸浆造纸、纺织加工……几乎每一个工业分支都在呼唤性能更优、更稳定、更具成本优势的酶,而AI辅助平台正在让这些诉求加速变成现实。

技术成熟度的提升同样不可忽视。2026年初发表的一篇酶工程前沿综述指出,该领域正从“单酶建模”向“多酶途径设计”升级,将序列、结构、反应环境与系统级约束整合进一个连续的“建模—设计—验证”框架,并为此划分了功能建模、结构建模和性质建模三大核心任务。AI在这三个维度上都已展现出可量化的能力突破。将这些能力打包成“开箱即用”的工程化工具,恰恰是平台的核心价值所在。

五、从“造分子”到“造系统”:酶工程平台的下一个五年

 

AI-Powered Enzyme Engineering Workflow

AI-Powered Enzyme Engineering Workflow


在学术前沿,AI在酶工程中的角色正从“辅助工具”向“协同科学家”演进。洪亮将其归纳为三个阶段:作为成熟工具的“过去式”,充当AI智能体辅助平台的“进行时”,以及能够主动提出科学假设、自主设计验证路径的“AI共研科学家”——那是“将来时”。

放大到产业层面,AI辅助酶工程平台正在从“分子改造工具”升级为“生物制造基础设施”。在合成生物学中设计并解除代谢通路瓶颈也好,推动生物基化学品和材料从实验室走向工业发酵罐也好,AI酶工程平台都在发挥核心支撑作用。行业标准化建设也已按下加速键。2026年,中国科学技术大学与中国标准化研究院联合编制的《智能科研平台标准白皮书》(2026版),从基础通用、数据、模型与AI底座、实验基础设施、平台安全、平台生态构建等六大维度搭建了标准化框架,推动智能科研平台从散落各处的“盆景”走向系统性的“风景”。

六、从手艺到工程,酶工程的真正拐点

还是那间实验室。65摄氏度的恒温罐中,AI设计的塑料降解酶正在安静工作。几年前,人类对这样的酶还只能望而兴叹——要么耗费数年从极端环境中艰难分离,要么用传统方法一轮接一轮盲筛,在漫长的等待中消耗光阴。

今天,一条自然序列、一个工业需求,输入智能平台。AI替你挖酶,替你定向进化,替你预测热稳定性,甚至在你犹豫的时候替你安排实验验证。你不再是漆黑洋面上撒网的人,而是有人为你指明了航向。

AI辅助酶工程平台的核心价值,不是跑得更快的算法,而是一整套把“科研生产力”从烦琐劳作中解放出来的基础设施。它让酶的设计变得可预测、可编程、可规模化交付,把一门几十年来依赖经验和耐心的技术,真正变成了一门工程。