project
Science Skills - 谷歌 DeepMind 开源的科研技能工具包
Science Skills 是谷歌 DeepMind 推出的开源科学技能集合,专为加速 AI Agent 驱动的科学研究工作流设计。工具整合 AlphaGenome、AlphaFold Database、UniPro...
Science Skills是什么
Science Skills 是谷歌 DeepMind 推出的开源科研技能集合,专为加速 AI Agent 驱动的科学研究工作流设计。工具整合 AlphaGenome、AlphaFold Database、UniProt 等 30 多个生命科学数据库与工具,覆盖基因组学、结构生物学、化学信息学和文献检索等领域,让研究人员能在几分钟内完成原本需要数小时的复杂分析任务。
Science Skills的主要功能
-
基因组学分析:通过 AlphaGenome 等技能进行基因变异注释、疾病关联分析和基因组数据挖掘。
-
结构生物学研究:集成 AlphaFold Database,支持蛋白质结构预测、分子对接和结构比对等任务。
-
化学信息学处理:提供化合物性质预测、分子筛选和药物发现相关的分析能力。
-
智能文献检索:通过 OpenAlex 等工具自动检索、筛选和综合学术文献,生成结构化综述。
-
多数据库整合:统一接入 30+ 权威数据库,实现跨数据源的一站式科学查询与分析。
Science Skills的技术原理
- 标准化 Skill 架构:Science Skills 采用统一的三层模块化协议:每个技能由
SKILL.md(含 YAML 路由 frontmatter 与 Markdown 执行指令)、scripts/(可执行脚本工具)和references/(按需加载的补充文档)组成,使技能具备可复用、可扩展和可维护的结构性。 - 渐进式披露与 Token 效率:通过分层架构替代传统单体指令:核心模块始终加载(仅保留 38.5% 必要内容),辅助内容(示例、背景、模板)在 Agent 通过工具调用明确需要时动态加载,将单次调用 Token 成本降低约 39%,实现端到端 43.2% 的节省。
- 脚本执行隔离
:scripts/中的代码在文件系统上直接运行,执行结果(如验证状态或数值)而非代码本身注入 Agent 上下文,相比传统”在对话中生成代码再执行”的方式减少约 89% 的 Token 消耗,同时保证执行确定性和可复用性。 - 路由层优化:每个
SKILL.md顶部的 YAML frontmatter 包含精简的路由描述,用于快速匹配用户请求与对应技能;通过压缩冗长说明、去除非路由相关内容(如功能列表、触发词枚举),确保仅加载必要的技能上下文,避免无关信息占用 Token。
如何使用Science Skills
- 安装技能包:通过 npx 命令一键安装完整技能集合:
npx skills add google-deepmind/science-skills/ - 在 Antigravity 中启用:下载 Google Antigravity 后,在「Build with Google」步骤中勾选 Science 插件;老用户可在设置中下载 Science 插件。
- 配置环境:首次触发 Science Skill 时,Agent 会自动安装
uv包管理器,安装完成后建议重启 Antigravity。 - 配置 API 密钥:部分技能如 AlphaGenome、OpenAlex需要 API 密钥,Agent 会引导获取并写入
~/.env文件。 - 自然语言调用:安装完成后,直接用自然语言向 Agent 提出科学问题,Agent 会自动加载相关技能并执行分析。
Science Skills的核心优势
- Agentic 工作流加速:将原本需要数小时的手动分析如结构生物信息学、基因组分析压缩至分钟级,显著提升研究效率。
- 深度数据 grounding:直接集成 30+ 权威数据库,确保分析结果基于最新、最可靠的科学数据,减少模型幻觉。
- Token 高效设计:针对科学任务优化,用更少的 Token 消耗完成更复杂的推理和分析。
- 标准化 Skill 架构:每个技能采用统一的
SKILL.md + scripts/ + references/结构,便于扩展、复用和社区协作。 - 完全开源:代码采用 Apache 2.0 许可证,文档采用 CC-BY 许可证,支持自由使用和二次开发。
Science Skills的项目地址
- GitHub仓库:https://github.com/google-deepmind/science-skills
Science Skills的同类竞品对比
| 维度 | Google DeepMind Science Skills | Elicit 2.0 | Perplexity AI Research Pro |
|---|---|---|---|
| 核心定位 | AI Agent 科学技能包,专注生命科学数据库整合与自动化分析 | 系统文献综述与假设映射工具 | 实时学术检索与引用追踪引擎 |
| 数据库覆盖 | 30+ 生命科学专用数据库(AlphaFold、UniProt、AlphaGenome 等) | 1.4 亿+ 学术论文 | PubMed、arXiv、Semantic Scholar 等 |
| 工作模式 | Agent 自主执行脚本,完成端到端科学分析任务 | 结构化数据提取与证据合成 | 实时检索 + 引用链重构 |
| 开源性 | 完全开源(Apache 2.0 + CC-BY) | 开源权重(Apache 2.0),可本地部署 | 闭源 SaaS |
| 适用场景 | 基因组/蛋白质/化学数据密集型研究 | 系统综述、Meta 分析、证据合成 | 快速文献调研、引用验证 |
Science Skills的应用场景
- 罕见病研究:快速分析基因突变与疾病的关联机制,如 DeepMind 团队曾用 Science Skills 发现 AK2 基因突变导致罕见遗传病的潜在机制。
- 蛋白质结构分析:批量预测和比对蛋白质结构,加速疫苗设计和酶工程研究。
- 药物发现:基于化学信息学技能进行化合物筛选和分子性质预测,缩短早期研发周期。
- 系统文献综述:自动检索、提取和综合数百万篇学术论文,快速生成领域综述报告。
- 跨学科数据整合:工具能同时查询基因组、蛋白质、化合物和文献数据,构建多维度研究洞察。