返回列表

AI定向进化:解锁蛋白质设计的未来密码

发布于 May 20, 2026

AI定向进化:解锁蛋白质设计的未来密码

一、蛋白质工程的“慢”与“难”

蛋白质是生命的功能元件,也是药物、食品、材料等产业的核心原料。但改造一个蛋白质,从来都不是一件容易的事。

传统蛋白质工程的核心手段是定向进化——灵感源于自然选择,通过随机突变结合高通量筛选,从海量变体中“淘”出性能更优的候选。这套方法在2018年获得了诺贝尔化学奖,但其代价也很直观:

周期漫长:一个抗体从发现到临床前开发,通常需要数月甚至数年;

效率极低:传统筛选成功率在0.1%–1%之间,大量实验资源消耗在“无效变体”上;

专业门槛高:需要资深专家的知识与经验,且高度依赖大型实验平台。

更深层的困境在于——自然进化的搜索空间是近乎无限的。一条300个氨基酸的蛋白质,可能的序列变体数量达20³⁰⁰,而实验能覆盖的只是沧海一粟。传统定向进化本质上是在一片漆黑中随机试探,效率的天花板早已可见。

那如果,我们能“看见”呢?

Protein Engineering

Protein Engineering

二、AI定向进化:从“自然选择”到“智能选择”

“AI定向进化”的核心思路并不复杂:用人工智能模型替代随机突变,直接预测哪些位点的哪些突变最可能提升目标功能,从而将搜索空间从“全量遍历”压缩到“精准制导”。

但“说起来简单”和“做出来可靠”之间,隔着三座大山:数据、模型、验证闭环

2.1数据底座:百亿级序列,覆盖极端环境

AI模型的能力上限,取决于训练数据的质量和覆盖度。

天鹜科技构建了名为VenusPod的蛋白质序列数据集,整合NCBI、UniProt、MGnify等各大数据库,积累了超过150亿条标注序列数据,其中包括65亿条真实实验功能标签。这些功能标签的数量是全球公共数据库标签总和的100倍以上。

这个数据集的显著差异化特征是:不仅涵盖常规生物信息,还包含从深海、火山等极端环境中采集的耐高温、耐强压、耐强酸/碱的蛋白质序列信息。这些极端环境序列天然编码了蛋白质在苛刻条件下维持功能的“密码”——当模型需要设计一个耐碱的工业用酶时,这些序列就是最稀缺的“教材”。

VenusPod数据集也因此在2025年“数据要素×”全国总决赛中荣获二等奖。

2.2模型引擎:从“序列到功能”的跨越

目前蛋白质AI领域的多数工作集中在结构预测或从头设计,但产业最迫切的需求是功能优化——让一个已有蛋白的活性更高、稳定性更强、亲和力更优。

天鹜科技自主研发的MatwingsVenus™(晓鹜™)蛋白质设计通用大模型,走的是第三条路:蛋白质定向进化。模型采用Transformer架构,在超大规模蛋白质数据上预训练,掌握了蛋白质序列、结构与其功能之间复杂的语义联系,实现了从“序列到功能”的直接预测。

该模型具备三大核心功能:AI定向进化——对一个已知蛋白进行多维度性能精准提升;AI挖酶——从数亿序列中发掘具有极端耐受特性的天然蛋白;AI从头设计——从零创建全新的结合蛋白。

2.3干湿闭环:设计即验证,验证即迭代

AI预测再准,不经过实验验证也只是“纸上谈兵”。蛋白质设计领域长期存在一个痛点:干实验(计算设计)和湿实验(物理验证)严重脱节

2026年4月,天鹜科技发布了对话式蛋白质研发智能体MatwingsVenus™(晓鹜™),核心突破就在于打通了这条“最后一公里”——构建了“对话式干湿闭环”

干实验端:用户通过自然语言输入任务目标,智能体自动拆解任务,调度设计、预测、分析能力;

无缝衔接:设计结果通过自主构建的通讯机制,自动导入质粒订购与实验编排流程;

湿实验验证:驱动机器人完成样品制备、蛋白纯化和功能检测;

数据回流:实验结果自动回传至下一轮AI设计,形成“计算驱动湿实验、湿实验反哺计算”的迭代闭环。

这意味着,过去只有大企业、大院大所才能掌握的完整研发能力,正在转化为个人也可调用的基础设施

三、案例验证:AI定向进化的真实落地

技术好不好,最终要看项目落地的效果。在AI定向进化方向,天鹜科技已积累多个成功案例,涵盖创新药、生物工艺、体外诊断等领域,例如碱性磷酸酶活性优化、GLP-1工具酶定向进化、极度耐碱单域抗体、胰腺炎诊断核心原料国产化、免疫调控受体靶点从头设计等,均已实现产业应用或进入放大生产阶段。

3.1创新药:免疫调控受体靶点从头设计

免疫调控受体是创新生物药研发中的高价值靶点,广泛涉及肿瘤、自身免疫病和炎症性疾病。但这类靶点从头设计结合蛋白的难度极大:选靶新颖、缺乏参考分子、靶点表面以极性区域为主、天然配体已具备纳米级高亲和力。

天鹜科技基于MatwingsVenus™(晓鹜™)平台,以靶点结构与功能需求为输入,Agent自动完成骨架筛选、界面设计、序列优化、成药性预判等全环节计算工作,快速输出高质量binder设计序列。经自动化实验平台验证,数十个设计分子在体外细胞活性实验中显示出明确的阻断活性,兼具功能抑制与高亲和力潜力。这是AI从头设计结合分子全流程验证的标志性案例。

3.2 体外诊断:AI改酶助力胰腺炎诊断核心原料国产化

α-O-寡糖苷EPS-G7是急性胰腺炎血液淀粉酶检测的关键底物,长期被国际巨头垄断,国内完全依赖进口。

天鹜科技联合合作伙伴,通过蛋白质语言模型对环糊精酶进行多目标定向进化——同时提升转糖苷活性、降低水解活性、增强区域选择性。仅一轮模型训练预测,即获得最优三点组合突变体,催化合成产物比例从63%提升至98%,转糖基化/水解比率提高了12倍。在100L中试规模下,产量达161 g/L,纯度99%以上。

这项成果发表于 《Bioresource Technology》 ,为胰腺炎诊断核心原料的国产替代开辟了新路径。

Cyclodextrinase Enables Precision a-O-Oligosaccharide Synthesis

Cyclodextrinase Enables Precision a-O-Oligosaccharide Synthesis

四、从工具到智能体:MatwingsVenus™(晓鹜™)的“个人可用”愿景

回顾天鹜科技的技术演进路线,可以清晰地看到一条从模型→工具→智能体的跃迁路径:

1.0阶段——大模型驱动:以通用大模型实现“序列直达功能”的预测能力,将研发周期从2-5年缩短至2-6个月。

2.0阶段——平台化整合:整合200+蛋白质设计工具、50+认证专家、30+领域专家调优的技能包,形成一站式研发平台。

3.0阶段——智能体闭环:发布MatwingsVenus™(晓鹜™)对话式智能体,打通干湿闭环,实现“设计即验证、验证即迭代”的自动化研发模式。

MatwingsVenus™(晓鹜™)的本质变化在于:它不是一个把功能堆在一起的工具箱,而是围绕任务目标自动组织工作路径的“AI科学家”。用户只需用自然语言描述需求——“我希望提高Cas12i3的活性”或“帮我找一些新的纤维素酶”——系统即可自动拆解任务、调度能力、执行验证、反馈迭代。

五、未来已来:AI定向进化的无限可能

Protein Structure

Protein Structure

从药物研发到生物材料,从农业酶制剂到个性化医疗,AI定向进化正打破蛋白质设计的边界。

蛋白质是创新药、体外诊断、工业酶、食品科技等众多领域的底层“芯片”。国内每年仅工业酶市场的进口替代空间就达百亿级。而AI定向进化的价值在于:通过“AI设计+自动化实验”实现标准化、高通量的蛋白分子交付,让蛋白质设计的门槛从“10年专业训练”降到“一次对话”。

MatwingsVenus™(晓鹜™)平台不仅是一个工具,更是一个连接“AI创造力”与“生物可能性”的桥梁。在这里,每个蛋白质都将拥有自己的“进化剧本”,而人类只需定义目标,剩下的,交给智能体与科学。