雞作為全球最重要的家禽之一,具有豐富的遺傳多樣性。然而,傳統(tǒng)基于形態(tài)特征的鑒定方法存在諸多局限性,難以滿足現代家禽育種和保護的需求。隨著全球遺傳資源交流的日益頻繁,準確鑒定雞遺傳資源對于保護地方品種、制定育種策略以及維持遺傳多樣性至關重要。
該研究整合了基因組單核苷酸多態(tài)性(SNP)變異信息和多種機器學習算法,對來自 132 個雞遺傳資源的 3,798 個個體的全基因組重測序數據和 600 K 芯片數據進行了分析。通過構建最大似然系統(tǒng)發(fā)育樹去除異常樣本,最終保留了 127個品種的數據。利用遺傳分化指數評估遺傳分化程度,并從每個遺傳資源中篩選出遺傳分化指數最高的100個SNP位點,采用梯度提升樹模型評估這些位點的重要性。通過比較7種不同機器學習模型的性能,確定最有效的機器學習模型。
研究發(fā)現,每個品種都具有近乎完全分化的位點。多分類邏輯回歸(MLR)模型被證明是雞種質資源分子鑒別最有效的機器學習模型,使用 2000個SNPs時,準確率達到 99.45%。
此外,該系統(tǒng)提供了用戶友好的在線網站(http://www.chickenbreeds.cn),用戶可以通過上傳vcf或gvcf格式SNP變異文件進行雞遺傳資源的鑒別。系統(tǒng)的通用性允許使用全基因組重測序和SNP芯片數據,并且具備數據上傳功能有助于持續(xù)擴展雞遺傳資源數據庫,實現更廣泛的品種鑒別范圍。
該分子鑒別系統(tǒng)為雞遺傳資源的保護和利用提供了一種快速、準確且低成本的方法。這不僅有助于保護地方品種的遺傳多樣性,還為制定創(chuàng)新的育種計劃提供了科學依據,支持家禽行業(yè)的可持續(xù)發(fā)展。該系統(tǒng)有望在農業(yè)科研和生產實踐中得到廣泛應用,為全球雞遺傳資源的保護和利用做出重要貢獻。
動物科技學院博士研究生職毅豪為論文第一作者,劉小軍教授、康相濤院士、李紅副教授、摩洛哥穆罕默德五世大學Badaoui Bouabid教授為論文共同通訊作者。該工作得到國家重點研發(fā)計劃課題(2022YFF1000202)項目資助。
論文鏈接:https://doi.org/10.1016/j.compag.2025.109989