人类历史首次,用AI生成全功能基因组!
1977年,生物化学家Frederick Sanger等人,完成了史上第一个基因组测序——噬菌体ΦX174。
40多年后的今天,斯坦福联手Arc Institute团队,以ΦX174为起点,用AI首次生成了噬菌体基因组。

其中一个,AI设计的噬菌体基因组,长的是这样子:


历史首次!AI生成「完整」基因组
在最新技术博文中,核心团队详细拆解了,成功设计首批AI生成基因组的秘诀。

不论是设计单个基因,还是一个完整的基因组,都是一项极具挑战的难题。
以遗传信息存储系统的历史来算,基因组大概存在了40亿年。而DNA基因组的存在,大约有35亿年。

因为,基因组设计,核心难题在于复杂性:多个基因相互作用,还要维持精妙的平衡,确保复制、宿主特异性和进化适应性。
这些挑战,在单个蛋白质设计中,根本不会存在。
为了攻克这一难题,斯坦福Arc Institute团队开发了一系列创新技术,其中包括:
一个为重叠阅读框定制的基因注释流程;用于从基因组语言模型中采样的系统性微调与提示词工程策略;一套为合成噬菌体基因组设计的全新筛选方案
ΦX174,跨越半个世纪接力赛
若要生成合成基因组,还得需要一个可靠的起点。
噬菌体ΦX174——一种微小的病毒基因组,只有5386个核苷酸,编码11个基因。

微调Evo,让AI更懂噬菌体
原有的Evo模型,基于海量噬菌体数据训练后,虽能生成序列,但缺乏针对ΦX174精准控制。
为此,监督微调,成为了不二选择。
团队又让Evo,在14,466精选的微小噬菌体序列上,继续训练在减少冗余后,模型专攻ΦX174相关变异。
微调后,通过精心设计的提示词和采样参数,Evo能生成与ΦX174进化相似却又创新的序列。
这就像给AI一个灵感模板,让它在熟悉中注入新意。

评估AI设计噬菌体的实验检测
这些AI基因组携带了67-392个,相较于其最近似天然基因组的新突变。
其中,Evo-Φ2147携带了392个突变,与噬菌体NC51的平均核苷酸同一性为93.0%。
根据某些分类学标准,它足以被认定为一个新物种。
另外,13个基因组包含自然界未见的突变,证明Evo能够利用自然进化从未涉足过的序列空间。
一个非常有趣的发现是,合成噬菌体之一Evo-Φ36整合了,远亲噬菌体G4的DNA包装蛋白——J蛋白(25 vs 38个氨基酸)。


总而言之,AI能快速筛选出有效的基因序列,这就让噬菌体疗法不再是碰运气的「试错」,而是精准的「设计」。
未来,人类能主动设计出领先一步的疗法,永远跑在细菌变异的前面。

核心作者
Brian Hie
我是斯坦福大学化学工程系的助理教授,以及Arc Institute创新研究员,致力于生物学与人工智能交叉领域的研究。
他曾获得了MIT CSAIL博士学位,本科就读于斯坦福大学。

Samuel King
Samuel King是斯坦福大学博士研究生,目前在Arc Institute从事合成生物学与ML交叉领域的研究工作。
他本科毕业于哥伦比亚大学(UBC),获得生物学荣誉学士学位。

参考资料:
https://x.com/samuelhking/status/1968329299364376698 https://www.biorxiv.org/content/10.1101/2025.09.12.675911v1
https://arcinstitute.org/news/hie-king-first-synthetic-phage
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237