AiOffice 能力组合,开箱即用,为您的工作流提速
STRING 是一个包含已知和预测的蛋白质-蛋白质相互作用的综合数据库,涵盖 5000 多种生物体中的 59M 个蛋白质和 20B+ 相互作用。查询交互网络、执行功能丰富、通过 REST API 发现合作伙伴以进行系统生物学和通路分析。
PubMed 是美国国家医学图书馆的综合数据库,提供免费访问 MEDLINE 和生命科学文献。使用布尔运算符、MeSH 术语和字段标签构建高级查询,通过 E-utilities API 以编程方式访问数据,以进行系统评价和文献分析。
PubChem 是世界上最大的免费化学数据库,包含 1.1 亿多种化合物和 2.7 亿多种生物活性。按名称、CID 或 SMILES 查询化学结构,检索分子属性,执行相似性和子结构搜索,使用 PUG-REST API 和 PubChemPy 访问生物活性数据。
RCSB PDB 是生物大分子 3D 结构数据的全球存储库。搜索结构、检索坐标和元数据,在 200,000 多个实验确定的结构和计算模型中执行序列和结构相似性搜索。
开放靶标平台是一个综合资源,用于系统识别和优先排序潜在的治疗药物靶标。它集成了公开可用的数据集,包括人类遗传学、组学、文献和化学数据,以建立目标疾病关联并对其进行评分。
代谢组学工作台是一个由 NIH 共同基金资助的综合平台,托管在 UCSD,作为代谢组学研究数据的主要存储库。它提供了对 4,200 多项经过处理的研究(3,790 多项公开可用)的编程访问、通过 RefMet 标准化代谢物命名法以及跨多个分析平台(GC-MS、LC-MS、NMR)的强大搜索功能。
LaminDB 是一个开源生物学数据框架,旨在使数据可查询、可追踪、可重现和公平(可查找、可访问、可互操作、可重用)。它提供了一个统一的平台,通过单个 Python API 将 Lakehouse 架构、谱系跟踪、特征存储、生物本体、LIMS(实验室信息管理系统)和 ELN(电子实验室笔记本)功能结合在一起。
KEGG(京都基因和基因组百科全书)是用于生物途径分析和分子相互作用网络的综合生物信息学资源。
人类代谢组数据库 (HMDB) 是一个全面、免费的资源,包含有关人体内发现的小分子代谢物的详细信息。
GWAS 目录是由国家人类基因组研究所 (NHGRI) 和欧洲生物信息学研究所 (EBI) 维护的已发表的全基因组关联研究的综合存储库。该目录包含来自数千份 GWAS 出版物的精选 SNP 性状关联,包括遗传变异、相关性状和疾病、p 值、效应大小以及许多研究的完整摘要统计数据。
Gene Expression Omnibus (GEO) 是 NCBI 的高通量基因表达和功能基因组学数据的公共存储库。 GEO 包含超过 264,000 项研究,其中来自基于阵列和基于序列的实验的超过 800 万个样本。
NCBI Gene 是一个整合了不同物种基因信息的综合数据库。它提供命名法、参考序列 (RefSeqs)、染色体图谱、生物途径、遗传变异、表型以及全球基因组资源的交叉引用。
通过 openFDA 访问全面的 FDA 监管数据,openFDA 是 FDA 为公共数据集提供开放 API 的举措。使用具有标准化接口的Python查询有关药品、医疗器械、食品、动物/兽医产品和物质的信息。
对跨多个领域的科学数据文件执行全面的探索性数据分析 (EDA)。该技能提供自动文件类型检测、特定格式分析、数据质量评估,并生成适合文档和下游分析规划的详细降价报告。
访问和查询 Ensembl 基因组数据库,这是由 EMBL-EBI 维护的脊椎动物基因组数据的综合资源。该数据库提供 250 多个物种的基因注释、序列、变异、监管信息和比较基因组学数据。当前版本为 115(2025 年 9 月)。
欧洲核苷酸档案库 (ENA) 是核苷酸序列数据和相关元数据的综合公共存储库。通过基因组学和生物信息学管道的 REST API 和 FTP 访问和查询 DNA/RNA 序列、原始读数、基因组组装和功能注释。
DrugBank 是一个综合性生物信息学和化学信息学数据库,包含药物和药物靶点的详细信息。该技能支持以编程方式访问 DrugBank 数据,包括约 9,591 个药物条目(2,037 个 FDA 批准的小分子、241 种生物技术药物、96 种营养保健品和 6,000 多种实验化合物),每个条目有 200 多个数据字段。
COSMIC(癌症体细胞突变目录)是世界上最大、最全面的探索人类癌症体细胞突变的数据库。以编程方式访问 COSMIC 广泛收集的癌症基因组数据,包括数千种癌症类型的数百万个突变、精心策划的基因列表、突变特征和临床注释。
ClinVar 是 NCBI 可免费访问的关于人类遗传变异和表型之间关系的报告档案,并附有支持证据。该数据库汇总了有关基因组变异及其与人类健康关系的信息,提供临床遗传学和研究中使用的标准化变异分类。
ClinPGx(临床药物基因组学数据库)是临床药物基因组学信息的综合资源,是 PharmGKB 的继承者。它整合了 PharmGKB、CPIC 和 PharmCAT 的数据,提供有关遗传变异如何影响药物反应的精选信息。获取基因药物对、临床指南、等位基因功能和药物标签,以实现精准医学应用。