一款新药从实验室走到药房,平均需要多久?
答案是:10到15年。
这不仅仅是时间的流逝,更是数十亿美元的真金白银。更让人绝望的是,这漫长的征途中,最大的拦路虎往往不是生物学本身的深奥,而是那些**"支离破碎、难以扩展"的工作流**——研究人员不得不在不同的软件、设备和数据库之间来回横跳,像个低效的搬运工。
但就在昨晚,OpenAI扔出了一枚深水炸弹:GPT-Rosalind。
这不仅仅是一个新模型,这是OpenAI向生命科学领域发起的正面冲锋。
被遗忘的名字,最硬核的致敬
OpenAI这次给模型起名,有点意思。
GPT-Rosalind,这个名字取自罗莎琳德·富兰克林——那位对发现DNA结构至关重要的化学家。说实话,历史有时候挺讽刺的,她的贡献长期被她的男性同事沃森和克里克的光芒所掩盖。
OpenAI这次特意点名致敬,不仅是为了"平反",更是为了定调:这是一个专属于生命科学领域的"推理伙伴",而不再是那个什么都懂一点、什么都不精的通用助手。
这标志着AI的角色发生了根本性的转变:从"什么都能聊两句"的通用模型,进化为垂直领域的特种兵。
暴打人类专家,这数据有点吓人
别以为这又是那种"画大饼"的PPT发布,OpenAI这次甩出的成绩单,相当硬核。
在BixBench(一个真实世界的生物信息学分析指标)测试中,GPT-Rosalind的成绩在已发布模型中直接登顶。
更让人坐不住的是LAB-Bench2的测试结果。在这个更细分的考场上,GPT-Rosalind在11项任务中有6项击败了GPT-5.4。特别是在CloningQA(克隆质量保证)任务中——这需要从头到尾设计分子克隆试剂——它的表现简直是碾压级的。
但这还不是最夸张的。
OpenAI找来了合作伙伴Dyno Therapeutics进行实战演练。在使用未公开、"未受污染"的RNA序列进行"序列到功能"的预测和生成任务时,GPT-Rosalind的表现让人倒吸一口凉气:
在预测任务中,它的成绩超过了95%的人类专家;在序列生成任务中,它达到了84%的分位。
这意味着什么?意味着在特定的生物学任务上,它已经不再是一个辅助工具,而是一个能够识别"专家级模式"的高级合作者。老实讲,这种级别的表现,通用模型根本连车尾灯都看不见。
科学家终于不用再做"表哥表姐"了
如果你身边有做生物科研的朋友,你一定见过他们那种被繁琐流程折磨到变形的脸。
查个蛋白结构要用这个库,搜个临床文献要用那个网,做序列操作还得换个软件。科研变成了"切屏"的艺术。
OpenAI显然看到了这个痛点。这次他们不仅发了模型,还在GitHub上推出了Codex的生命科学研究插件。
这不仅仅是个插件,这是个"指挥官"。
它直接把模型连接到了超过50个公共多组学数据库和文献源。以前需要科学家手动查半天、对半天的数据,现在通过这个"编排层",可以自动化完成。
这就像是你以前得自己去菜市场买菜、杀鸡、拔毛,现在直接给你送来了一盘切好配好的净菜。安进的高级副总裁Sean Bruich说得就很直白:这能让我们"加速向患者输送药物"。
想用?先过"政审"这一关
能力越大,责任越大,限制也就越多。
既然能 redesign 生物结构,这玩意儿要是落在坏人手里,后果不堪设想。所以,OpenAI这次没敢搞什么"开源"或者"公测"。
想用GPT-Rosalind?请走"可信访问计划"。
目前,这个模型仅对美国地区的合格企业客户开放。而且,不是你有钱就行,组织必须经过严格的资格审查和安全审查,证明你是在搞合法的、对公众有益的研究。
而且,即便你进去了,也得在严格的"防滥用控制"下操作。不过有个好消息:在预览阶段,这玩意儿不扣你的token额度,算是给科研党的一点福利。
这种小心翼翼的姿态,恰恰证明了它的强大。
英伟达和Moderna都站队了
这波发布,科技圈和制药圈的大佬们都在摇旗呐喊。
英伟达医疗健康副总裁Kimberly Powell说,这能把"数年的传统研发压缩为即时的科学洞察";Moderna的CEO Stéphane Bancel更是盛赞其能够"跨越复杂的生物证据进行推理"。
这不仅仅是商业互吹。此前OpenAI和Ginkgo Bioworks的合作已经实打实地证明,AI模型帮助降低了40%的蛋白质生产成本。
从Ginkgo Bioworks的成本大降,到如今GPT-Rosalind在RNA序列预测上的逆天表现,OpenAI正在把生物学从一门"实验科学"变成一门"数据科学"。
谁才是实验室的主人?
OpenAI这次的动作,与其说是发布了一个新模型,不如说是重新定义了科研工作流。
当AI开始在特定领域击败95%的人类专家,我们不得不面对一个现实:科学家在实验室里的角色,正在被重写。
以前我们说AI是副驾驶,现在看,在生命科学这种"大海捞针"的领域,AI可能正在抢夺方向盘。至于人类是会成为那个只会踩刹车的乘客,还是成为指挥AI车队的队长?
这可能是未来10年,所有科研人员都要思考的问题。
【锐评】:
当AI开始比95%的专家更懂RNA序列,科学家们该担心的不是失业,而是如何学会驾驭这位智商爆表的"数字同事"。
参考链接:
https://venturebeat.com/technology/openai-debuts-gpt-rosalind-a-new-limited-access-model-for-life-sciences-and-broader-codex-plugin-on-github