生命科学领域已步入计算规模的新纪元。过去十余年间,英伟达构建了全面的 GPU 加速计算堆栈,涵盖硬件、框架、库、模型、微服务及领域特定工具,旨在协助研究人员执行更复杂的任务并加速迭代。

本周,Anthropic 推出了 Claude Science,一个面向科学研究的 AI 工作台,允许科学家通过自然语言与代理进行交互,从而端到端地完成研究工作。

Claude Science 集成了 NVIDIA BioNeMo Agent Toolkit,作为科学家在工作流程中可用的资源。该工具包将英伟达的加速功能打包成可调用的技能,使 Claude Science 能够选择合适的工具、准备有效的输入并执行工作流程,同时还能连接到部署在任何地方的英伟达计算资源。这使得英伟达的加速模型、库以及 NVIDIA NIM 微服务能够直接整合到研究发生的同一环境中。

全球顶尖的制药公司利用英伟达技术在药物发现、基因组学、医学影像、分子设计和蛋白质工程等领域推进 AI 驱动的研究。目前,排名前 20 的制药公司中有 18 家在使用 NVIDIA BioNeMo,这凸显了其在整个生态系统中的广泛作用。

推动科学发现的代理时代

Claude Science 使科学家能够使用自然语言将研究意图转化为行动,而无需手动配置模型、端点或软件环境。NVIDIA BioNeMo Agent Toolkit 进一步扩展了这一能力,提供了对 Evo 2、Boltz-2 和 OpenFold 3 等加速工作流程和模型的访问,从而加快了受益于加速的分析速度。

科学家首先用自然语言描述研究任务,例如分析基因组序列、预测蛋白质结构或设计潜在的结合剂。Claude Science 会解析请求,并通过预先配置的、了解基因组学、蛋白质组学、单细胞分析、化学信息学和临床研究中既定工作流程的领域专业代理来协调工作。

BioNeMo Agent Toolkit 为这些代理提供了连接每个步骤与适当的英伟达科学能力所需的上下文。每个技能都包含有关其目的和所需输入的信息,帮助代理准备和执行工作流程,并返回结果供审查。

由此产生的科学推理与加速计算工作之间形成了一个迭代循环。科学家可以检查输出、完善问题并确定下一步,同时保持对科学本身的专注。

一个强大的例子是生成更好的常见癌症靶点抑制剂。在此工作流程中,科学家从已知的致癌抗原突变开始,并要求 Claude 设计多种潜在的抑制剂。Claude Science 与 BioNeMo Agent Toolkit 和 NVIDIA NIM 微服务集成,加速了高通量抑制剂的预测、优化和验证。

为代理构建的科学基础

AI 代理能够推理、规划并使用工具来完成任务。在生命科学领域,这些工具通常是专门的计算工作流程。

一个自主的 AI 科学家代理并非孤立地进行推理。它可能需要对化合物库进行指纹识别,对有希望的命中进行聚类,为顶尖候选物生成构象,分析基因组上下文,并比较扰动反应,然后才能推荐下一步实验。

每个步骤都依赖于一个科学工具,而代理的运行速度取决于这些工具的运行速度。

NVIDIA BioNeMo Agent Toolkit 为科学代理提供了以科学速度运行所需的加速工具。它包括:

  • NVIDIA Parabricks 将基因组分析时间从数小时缩短到数分钟,使代理能够近乎实时地将基因组上下文整合到决策中。
  • scverse 开发的 RAPIDS-singlecell 将一个包含 130 万个细胞的预处理和聚类工作流程从 52 分钟压缩到 25 秒,使单细胞分析成为推理循环的一部分,而不是离线的批量作业。
  • nvMolKit 将相似性搜索和构象生成等化学信息学操作的速度提高了 3000 倍,使代理在庞大的化学空间中进行迭代时能以思维的速度获得结果。
  • NVIDIA BioNeMo 开源模型提供由英伟达库加速的核心生物分子能力,使代理能够在工作流程的每个步骤中拥有专门构建的科学模型。
  • BioNeMo NIM 微服务将这些模型打包成企业级推理端点——容器化的微服务,集成了完整的加速软件堆栈并针对高性能推理进行了优化——使代理能够调用一个稳定的应用程序编程接口进行生产部署。

NVIDIA BioNeMo Agent Toolkit 是开放的且不依赖于特定平台,允许相同的科学技能在不同的代理框架和研究平台之间工作。该工具包及其技能现已通过 NVIDIA 开发者资源和 GitHub 提供。

科学家可以通过 Anthropic 的 Claude Science 访问 BioNeMo 驱动的工作流程,该平台今天开始进入公开测试阶段。作为公开测试的一部分,Anthropic 邀请研究人员就他们需要的其他领域专家和集成提供反馈。