Equity Scorer 是一款专门用于从基因组数据中计算多样性与健康公平性指标的生物信息学工具。它实现了 HEIM(Health Equity Index for Minorities,少数群体健康公平指数)框架,旨在量化数据集、生物库或研究在多大程度上代表了全球人口的遗传多样性。该工具能够处理标准的 VCF 文件或包含祖先信息的 CSV 文件,通过分析杂合度、FST 值和主成分分析(PCA)等关键遗传学参数,为研究人员提供关于其样本群体代表性的深入洞察。Equity Scorer 的核心价值在于将复杂的群体遗传学分析转化为易于理解的综合性评分和可视化报告,帮助科研人员在设计和管理人群队列时做出更公平、更具包容性的决策。
核心功能特点
- 计算每个群体的观察杂合度和预期杂合度
- 计算群体间的成对 FST 固定指数
- 执行基因型数据的主成分分析(PCA)并生成可视化图表
- 生成一个 0-100 分的 HEIM 公平性综合评分
- 总结并可视化数据集的祖先构成分布
- 自动生成包含表格、图表、方法和可复现性代码块的完整 Markdown 分析报告
适用场景
Equity Scorer 特别适用于需要评估其研究人群遗传多样性代表性的场景。例如,当一个研究团队计划开展一项全基因组关联研究(GWAS)时,他们可以使用 Equity Scorer 来分析其招募的样本是否涵盖了足够广泛的全球人群,以避免结果过度偏向欧洲血统的人群,从而提升研究成果的普适性和公平性。另一个典型应用场景是生物库(如 UK Biobank)的管理者,他们可以利用该工具监控其样本库的群体构成变化,识别出某些地理区域或族群的不足,并据此制定更具针对性的招募策略。此外,在比较两个或多个不同人群的队列时,Equity Scorer 提供的标准化评分和详细指标可以帮助研究人员客观地评估各队列的多样性水平,为跨研究的数据整合和分析提供重要参考。
