AI for Protein:当人工智能学会“造物”,蛋白质设计迎来iPhone时刻
发布于 May 20, 2026

引言:一场正在发生的模式革命
在我们身体的每一个细胞里,在蜘蛛编织的坚韧丝线上,在深海热泉微生物的耐热酶中,大自然早已展示了其作为顶级分子工程师的精湛技艺。蛋白质,这些由20种氨基酸编织而成的精密分子机器,驱动着几乎所有的生命活动——从肌肉收缩到免疫防御,从光合作用到基因编辑。
然而,在过去漫长的岁月里,人类对蛋白质的利用方式堪称“拙劣”。我们只能从自然界中“淘金”,在成千上万种天然蛋白质中筛选出勉强可用的候选分子,再通过漫长的随机突变来碰运气。改变一个氨基酸的位置,搜索空间就有约6000种可能;改变两个,飙升到2300万;改变三个,直接进入500亿的量级——而一个平均大小的蛋白质包含361个氨基酸,理论上可能的序列组合是20的361次方,这是一个连宇宙原子总数都望尘莫及的数字。
在这样的“蛋白质宇宙”中,传统方法无异于盲人摸象。一个成熟的科研人员需要十年以上的训练才能独立设计出有功能的蛋白质;成功改造出一个达到工业级性能的蛋白质分子,往往需要2到5年的试错。这不是研发,这是靠人力和时间“堆”出来的运气。
但这一切正在被改写。改写它的力量,来自人工智能。

AI-protein design
一、从“AlphaFold时刻”到“设计即验证”
如果说有什么事件可以被视为“AI for Protein”的元年标志,那无疑是2024年诺贝尔化学奖的归属。那一年的诺贝尔化学奖一半授予DavidBaker,以表彰他在计算蛋白质设计方面的开创性贡献;另一半则授予DemisHassabis和JohnJumper,以表彰他们在蛋白质结构预测领域的革命性突破。
这个奖项传递了一个清晰的信号:AI已经不再是生物学的辅助工具,而是成为驱动蛋白质科学前进的核心引擎。
短短数年间,从AlphaFold系列到RoseTTAFold,从RFdiffusion到ProteinMPNN,深度学习模型在蛋白质结构预测和设计领域实现了原子级别的精度。生成式AI的引入,让蛋白质设计从“显式能量函数优化”的传统模式,一跃进入“概率生成建模”的新纪元——AI不再只是预测已有蛋白质的样貌,更开始创造自然界从未存在过的全新蛋白分子。
结构生物学正在进入AlphaFold2突破之后的“第二波浪潮”:蛋白质构象全景预测和蛋白质结合体的常规从头设计,正在成为两个全新的前沿。AI驱动的蛋白设计平台正将原本高度依赖经验和筛选的流程,转变为可扩展的工程化体系,并在实验中实现了极高的成功率。
这场变革的底层逻辑其实很简单:当AI不仅能够“看懂”蛋白质,还能“设计”蛋白质的时候,游戏规则就彻底变了。
二、干湿闭环:从“纸上推演”到“造出来”
然而,一个容易被忽视但至关重要的问题是:AI设计出来的蛋白质,真的“能用”吗?
这是一个灵魂拷问。在蛋白质工程领域,长期存在着一道“最后一公里”的鸿沟——计算机上精美的分子设计,和实验台上能够稳定表达、发挥功能的真实蛋白之间,有着巨大的距离。设计一个蛋白质的骨架结构是一回事,让它真正在细胞中表达出来、折叠正确、具备活性,又是另一回事。
这也正是整个行业正在全力突破的方向:打通AI设计与实验验证之间的循环。
AI for Protein的完整图景,不只是一堆算法模型的堆砌,而是一个“设计→验证→反馈→再设计”的螺旋上升闭环。2025年发表在《Nature Reviews Bioengineering》上的一篇重要综述提供了一个实用的路线图,将AI工具分为七个工具包,覆盖从初始设计到实验验证的全流程,并指出AI正在从根本上重塑蛋白质设计——曾经是反复试错的过程,如今正在变成一门可预测、可复现的工程学科。
这一闭环之所以关键,是因为AI模型的预测能力需要高质量湿实验数据来“喂养”和校准。谁拥有高效的实验验证能力,谁就能形成“数据飞轮”——每一次实验结果都在训练更强的AI,更强的AI又产生更精准的设计,如此循环往复,研发效率和成功率将远超传统模式。
这意味着,AI for Protein领域的竞争维度,已从算法性能的单点比拼,转向设计—验证闭环的系统性效率之争。
三、中国力量:当蛋白质研发变成一个“对话”就能搞定的事
在全球AI蛋白质赛道的竞速中,中国企业并未缺席。据市场数据显示,当前布局AI蛋白质领域的中国企业约有30家,主要集中在产业化落地方向——强调技术的实用性与交付效率,致力于将AI蛋白质设计从实验室推向工厂和临床。
而在这个群体中,一家来自上海的公司——天鹜科技,正在以一种独特的路径重构蛋白质研发的方式。
天鹜科技由上海交通大学特聘教授洪亮于2021年创立,核心团队深耕生命科学与人工智能交叉领域。公司CTO刘灏将传统蛋白质研发的痛点概括为一个词:“大海捞针”。蛋白质设计序列组合空间之巨大,远超人类能通过实验穷举的边界。传统方法下,实验阳性率仅约0.1%,而借助AI大模型,天鹜团队将这一数字提升到了30%左右,研发周期从2到5年压缩到2到6个月。
支撑这一效率跃迁的,是天鹜科技构建的包含近90亿条蛋白质序列的超大规模数据集——不仅覆盖常规物种,更整合了来自火山、深海等极端环境的特殊序列,其中约5亿条附带温度、酸碱度等功能标签,让模型建立起从“序列”到“功能”的精准映射能力。
但这些都不是最让人兴奋的部分。
2026年4月24日,天鹜科技发布了一款名为MatwingsVenus™(晓鹜™)的对话式蛋白质研发智能体,将“AI for Protein”带入了全新的人机交互阶段。
MatwingsVenus™(晓鹜™)的核心设计理念,是将过去只有大型科研机构和头部企业才能掌握的蛋白质研发能力,转变为个人开发者也能轻松调用的“共享实验室”。用户只需通过自然语言描述需求——就像用聊天软件和一个精通蛋白质设计的专家对话那样——平台上的智能体就会自动拆解任务,调用整合的200多种蛋白质设计工具、百亿级标签数据库以及30多个经过各领域专家调优的Skills,完成从行业研究、靶点分析、蛋白质设计到实验验证的全流程工作。
更关键的是,MatwingsVenus™(晓鹜™)打通了数字世界与物理世界的壁垒。当AI完成蛋白质设计后,平台可以自动将结果导入自动化湿实验流程,驱动机器人完成样品制备、蛋白纯化和功能检测,实验数据再回流至下一轮AI设计。这种“设计即验证、验证即迭代”的干湿闭环模式,让蛋白质研发不再是一个依赖大型团队协作、在多个工具间反复切换的冗长过程,而成为一个可持续迭代的智能化基础设施。
用天鹜科技创始人洪亮的话来说,这是一次科研组织模式的技术革命。AI+自动化工具的出现,使得某些以往需要高成本和极高专业门槛的科研技能正在“走下神坛”——虽然这可能会淘汰一些传统岗位,但势必会释放更多个人和极小团队去做个性化创新,推动生产力的跃迁式发展。
四、真实世界的验证
一个平台的价值,最终要看它能不能在真实世界中交付成果。天鹜科技用扎实的产业化案例给出了答案。
案例一:4个月“驯服”强碱,全球首个大模型设计的5000升工业化蛋白产品
生长激素的生产纯化过程中有一道关键工序——亲和层析,需要在pH高达13-14的极端碱性条件下进行清洗和再生。传统蛋白材料在这种环境中极易失活,需频繁更换,成本居高不下。
天鹜科技与国内生长激素龙头企业金赛药业合作,完全通过AI大模型设计,结合少量湿实验闭环迭代验证,仅用4个月时间,便成功将一个普通非耐碱单域抗体的耐碱性提升了4倍,并成功应用于5000升的工业化放大生产中。据测算,这一突破每年可为企业节省超千万元成本。这不仅标志着全球首款经大模型设计实现5000升工业化生产的蛋白质产品落地,更意味着“AI设计—工业化生产”的通道被真正打通。
%2C%20eLife%20(2025).png%3F2026-05-21T06%253A45%253A35.679Z&w=3840&q=75)
1.Science Advances (2024), eLife (2025)
%2C%20eLife%20(2025).png%3F2026-05-21T06%253A45%253A52.301Z&w=3840&q=75)
2.Science Advances (2024), eLife (2025)
案例二:跨国巨头牵手中国AI,拜耳押注蛋白质智能设计
2025年11月,在第七届进博会上,拥有160多年历史的跨国生命科学巨头拜耳健康消费品与天鹜科技签署战略合作协议,宣布双方将进一步加深AI技术在消化道和皮肤健康领域的科研探索、新品研发及应用转化合作。据悉,这是双方基于前期合作的加码和升级。一家百年跨国企业选择一家成立仅数年的中国AI蛋白质设计公司作为战略合作伙伴,这本身就是对技术实力的强力背书——当AI蛋白质设计成为健康消费品的创新引擎,从功能护肤到肠道健康,蛋白质分子设计正在进入每个人的日常生活。

Signing ceremony
这些案例指向同一个结论:AI for Protein已经走出“技术验证”阶段,进入“工程交付”时代。无论是制药、诊断、环保还是消费品,AI蛋白质设计正在从实验室走向产业化深水区,从“能不能做到”的炫技,变成“能省多少成本、能创造多大价值”的硬核交付。
五、展望:蛋白质的“iPhone时刻”
如果说生物制造是未来产业的基石,那么蛋白质设计就是生物制造的底层芯片。无论是创新药、功能食品、农业科技还是生物基材料,高性能蛋白质都是核心的功能元件。而AI for Protein正在让这个“底层芯片”的开发,从一项高度依赖经验、耗费大量资源的“手艺活”,变成一种可以被标准化、自动化、普惠化的能力。
回顾计算机行业的历史,大型机时代只有少数机构能用得起计算机,直到个人电脑和智能手机的出现,计算能力才真正走进每个人的口袋。蛋白质设计正在经历类似的“个人化”进程——当像MatwingsVenus™(晓鹜™)这样的对话式智能体将AI设计能力、自动化湿实验和专家智慧打包为“共享实验室”,蛋白质研发就不再是少数大平台的专属特权,而是每一个有想法的科研人员和创业者都可以调用的基础设施。
正如有行业分析师所言,这种模式的本质是从“卖软件”转向“卖服务/卖分子”,解决了蛋白质设计领域“最后一公里”的交付难题。而中国企业在AI蛋白质赛道上独有的“产业化躯干”定位,或许恰好踩中了这个行业从“炫技”到“落地”的关键转折点。
2020年,AlphaFold2的出现让整个生物学界发出惊叹。今天,AIforProtein的故事正在进入更激动人心的章节——它不再只是一个预测结构的工具,它正在成为一个真正能“造物”的生产力引擎。而当这个引擎变得足够普惠、足够好用的时候,我们或许真的会迎来属于蛋白质设计的“iPhone时刻”。
“让每个人都可以开发出自己想要的蛋白。”——这不再是一句口号,而是一个正在被验证的现实。
THE END