返回列表

蛋白质序列设计工具:从三件套到AI智能体干湿闭环

发布于 May 18, 2026

蛋白质序列设计工具:从三件套到AI智能体干湿闭环

2024年诺贝尔化学奖颁给David Baker、Demis Hassabis和John Jumper之后,蛋白质设计真正出了圈。AlphaFold、RFdiffusion、ProteinMPNN——这些工具的名字开始频繁出现在学术会议、融资新闻甚至政府报告里。

但用过的人都知道一个尴尬的现实:我们算得越来越准,却卡在“验证”上过不去。

设计一条序列,ProteinMPNN几秒钟就出来了。但这序列到底能不能表达、能不能折叠、有没有活性?这个问号需要发给另一拨人、另一套设备、另一个预算周期。等上两三周拿到结果,发现不行,却分不清是计算的问题还是实验的问题。

而这个断层的背景是:蛋白质工程全球市场规模在2026年已突破42.5亿美元,年复合增长率超过16%。资本涌入、论文井喷、工具迭代——行业的真正拐点,已经不是“AI能不能设计蛋白”,而是“谁能高效地把设计和验证串起来”。

这正是本文想聊的核心:在蛋白质序列设计工具的演进中,行业正在探索怎样的新范式?

 Protein Sequence design tool

Protein Sequence design tool

一、蛋白质序列设计工具的技术进化史:从 “猜序列” 到 “造蛋白”

先简单回顾一下这个领域的技术脉络。

传统蛋白质序列设计长期依赖定向进化和高通量筛选,需要合成和测试数以万计的序列,周期动辄数月甚至数年,成功率仅0.1%-1%。深度学习的入场改变了局面:ProteinMPNN基于消息传递神经网络实现了秒级序列生成,序列恢复准确率超过52%;RFdiffusion则补上了“从头设计骨架”的能力,让蛋白质从头设计成为系统化的工程流程。


于是,一个经典的三件套工作流逐渐成型:RFdiffusion(生成骨架)→ ProteinMPNN(填充序列)→ AlphaFold(验证结构)。这套流程在科研圈广泛使用,催生了ProteinDJ等模块化设计pipeline。

但它有一个根本性缺陷:只管计算,不管验证。

一个算出来的序列能不能在实验室里表达、折叠、发挥功能?这个问号需要交给另一群人、另一套设备、另一笔预算来回答。反馈链路极长——从序列设计到湿实验验证,一轮迭代往往需要数周甚至数月。

与此同时,许多蛋白质序列设计工具都是作为独立模块发布,缺乏任务级的智能调度能力。一个完整的研发项目需要手动切换5-8个工具,从结构预测到序列生成到成药性评估,每个工具都有自己的环境、格式和参数体系。这就带来一个悖论:我们拥有了前所未有的计算能力,却依然受困于工具碎片化和验证断层——蛋白质设计的真正效率瓶颈不在计算端,而在从“设计结果”到“实验反馈”的传导效率上。


二、行业在尝试什么:从“工具”到“闭环”

注意到这一矛盾之后,行业出现了明显的范式转向:从开发“单一设计工具”转向构建“设计-验证一体化平台”。2025年起,学术界已开始探索智能体辅助蛋白质设计的框架。而2026年4月,“大零号湾”发布了一款产品——天鹜科技的对话式蛋白质研发智能体MatwingsVenus™(晓鹜™) 。从行业观察的角度,这个产品有意思的地方在于,它的思路不是做“又一款蛋白质序列设计工具”,而是把设计、验证、专家智慧整合在一个对话式智能体中,直接跑完从设计到验证的全流程闭环。


具体做法是:用户用自然语言提出研发需求后,Agent自动拆解任务,调用集成的200多种蛋白质设计工具百亿级真实标签蛋白质数据库完成计算设计;然后通过平台自建的通讯机制,将设计结果直接导入自动化实验室——机器人完成样本制备、蛋白纯化、功能检测——实验数据再自动回流至AI模型,启动下一轮优化。

这就是“设计即验证、验证即迭代”的干湿闭环

这件事值得关注,不仅因为它在工程上把过去两拨人(计算团队和实验团队)之间的项目管理系统、邮件往来、排期等待压缩成了一个连续的自动化流程,更因为它代表了一种新的研发理念:蛋白质序列设计工具不应该只停留在计算层,而是应该有能力“跑完全程”。


三、从一个案例看闭环的价值

天鹜科技与金赛药业的合作项目是一个值得拆解的样本。

目标是改造一种在极端工业条件下使用的碱性蛋白质。依托AI定向进化能力,团队仅用4个月完成了改造——使目标蛋白在pH 13-14的极端环境下的耐碱性提升4倍、使用寿命延长一倍,并成功实现5000升规模的工业化生产,成为全球首个大模型设计蛋白质产业化落地的案例,每年为企业节省超千万元成本。

这里的关键不在于“AI设计了一条序列”,而在于从设计到验证到放大生产,整个链条是在一个平台上连续完成的。这种闭环效率,是传统“设计-邮件发送-排队等待实验”模式无法比拟的。

四、一个正在发生的趋势:蛋白质设计的“普惠化”

2024年,诺奖让我们看到蛋白质设计的科学价值;2025-2026年,市场在验证它的产业价值。当蛋白质序列设计工具的形态从“分散模块”走向“智能体闭环”,一个更深层的变化正在发生:蛋白质研发正在从“大平台驱动”走向“个人可用”。

过去,一条完整的蛋白质设计-验证流水线需要顶尖的计算资源、专业的湿实验团队和数年经验积累,本质上是大型药企和顶级院所的专属能力。而现在,通过“AI设计+共享自动化实验室”的模式,这种能力正在被封装成可通过自然语言调用的基础设施。据行业分析,2025年全球AI驱动蛋白质设计市场收入约35.86亿元,预计2032年将接近102.5亿元,年复合增长率约15.8%。推动这一增长的,正是设计能力的普惠化——越来越多中小创新主体开始参与蛋白质研发,而他们需要的,是一个能把“设计”和“验证”同时交到手里的工具。

蛋白质序列设计工具的下一个竞争维度,不再是“谁的算法更准”,而是“谁能把设计到验证的整条链路跑得更快、更稳、更可及”。

天鹜科技是这一方向的探索者之一。我们也在持续关注行业的变化和同行的实践。如果你对这个方向有兴趣,欢迎在评论区聊聊——你用过哪些蛋白质序列设计工具?你对干湿闭环的落地怎么看?