网站首页

联系我们

学院公众号

科学研究

MER:我校科研团队基于新算法构建濒危动物近交检测的最佳方案

来源: 日期:2025-12-01 阅读:

近亲繁殖往往伴随着近交衰退,对濒危动物的长期生存构成严重威胁。在野生动物研究中,全基因组中的连续纯合片段(ROH)是评估基因组近亲繁殖水平的核心指标。但是,参考基因组和测序数据质量会引起ROH检测的系统性偏差。对于濒危物种,我们往往难以获取高质量样本,而非损伤样本(如粪便、毛发)进行全基因组测序时,获取的数据质量往往较差,这时我们既无法获取高质量参考基因组,也无法获取高质量重测序数据,这就极大地限制了对ROH的准确检测。

针对上述问题,我校兰天明团队基于Gap-Merging算法,以东北虎基因组数据为参考,通过大量数据模拟,构建了一种不同条件下检测濒危动物近交水平的最佳方案。该方案系统测试了在不同参考基因组质量(13Contig N50水平)、不同测序参数(15组测序深度和5组测序读长)、不同近交水平(8组)以及不同遗传距离(5组)条件下,ROH检测准确性受到的实际影响并提出了矫正方案(图1)。研究首先比较了检测近交最常用的两个软件PLINKBCFtoolsROH检测的局限性,发现二者在检测500kp以下ROH片段时均存在较大误差,且BCFtools造成的误差更大,因此在后续研究中不考虑500kb以下的ROH片段并使用PLINK软件进行评价研究。

1 总体研究方案

研究发现,当测序深度达到时,就可以对整体的近交水平(FROH)进行较为准确的评估,且近交水平越高越容易被准确评估,对于高度近交的个体(FROH > 30%),甚至 3× 深度也能反映大致水平。但是只有当测序深度在15×以上时,基因组中单一ROH片段才能被准确检出(可以用来追溯近交历史)。在15×的测序深度下,FROH 错误率仅为0.66% ± 1.01%,随着深度增加逐渐下降至100×时的0.02% ± 0.07%(图2)。需要注意的是,在深度附近会出现一个高估峰,需谨慎对待。无论是常用的150bp100bp,还是模拟古DNA的短读长(30-75bp),读长对ROH检测结果没有显著影响。

2 测序深度对ROH检测准确性的影响

对于基因组连续性而言,当Contig N50降至0.6 Mb以下时,可检测到的ROH片段数量显著增加(图3),这表明随着基因组连续性的降低,较大的ROH片段在检测过程中更容易被碎片化;此外,当Contig N50达到2 Mb时,FROHROH片段的平均长度都能被准确检测。因此,Contig N50 >0.6 Mb的参考基因组足以评估总体近交水平(FROH),但更完整的基因组(Contig N50 >2 Mb) 是准确追踪近交历史的必要条件(ROH的长度)。但此参数必须在Gap-Merging的计算方法下才成立,如果不使用Gap-Merging算法,需要更大的Contig N50>4Mb)才能达到准确检测的目标。

3 参考基因组连续性对ROH检测准确性的影响

在实际情况中,濒危物种可能由于采样困难无法获取高质量DNA,因此无法获得参考基因组,此时就不得不使用近缘物种参考基因组检测ROH。研究测试了选用不同亚种和不同物种参考基因组时对ROH检测的准确性影响,研究表明亚种内参考基因组比跨物种参考基因组更适用于近交评估(测试对象为猫科动物),但仍然存在一定差异,不同虎亚种之间进行ROH检测时,参考基因组的通用性较好,但是当ROH片段大于5Mb时依然会受到遗传距离的影响(图4)。例如:在评估东北虎的近交水平时,使用华南虎的参考基因组效果优于孟加拉虎,而使用狮子或家猫的基因组则会严重低估ROH片段和近交系数。因此,当一个物种没有参考基因组时,尽量使用FROH参数评价近交,而非ROH长度信息。

使用不同遗传距离参考基因组检测ROH结果差异

最后,研究对使用PLINK软件进行ROH检测的各项参数在低质量数据情况下均进行了调整和优化。无论测序深度低还是参考基因组连续性不足,优化参数后的检测对FROHROH检测的准确性都明显高于默认设置。

例如:针对低深度数据(如),推荐使用参数:bash -indep-pairwise 50 1 0.8 -homozyg-window-snp 80 -homozyg-snp 150;针对高度近交个体(FROH > 50%): 可将 -homozyg-window-snp 降至 70。针对高度碎片化的参考基因组(N50 < 100 kb): 建议将 -homozyg-window-snp 设为 10-15。该研究提出的ROH检测方法对于野生动物,尤其是濒危动物的ROH检测提供了重要参考(图5)。

5 基于Gap-Merging算法检测全基因组水平ROH的最佳方案

20251128日,该成果以“Optimising genome-wide detection of runs of homozygosity: impacts of reference genome quality and sequencing parameters on inbreeding assessment”为题发表在生态学主流期刊Molecular Ecology Resources(分子生态资源)。该项研究得到国家自然科学基金和黑龙江省重点研发计划等项目共同资助。我院兰天明教授为论文通讯作者,李海盟副教授和施敏辉博士为论文共同第一作者。