本網(wǎng)訊 近日,安徽農(nóng)業(yè)大學農(nóng)學院水稻分子育種創(chuàng)新團隊聯(lián)合華中農(nóng)業(yè)大學、中國農(nóng)業(yè)科學院作物科學研究所在國際權(quán)威期刊《Plant Biotechnology Journal》(中科院1區(qū)TOP,五年影響因子12.1)在線發(fā)表了題為“MFMGP: an integrated machine learning fusion model for genomic prediction”的研究論文(https://doi.org/10.1111/pbi.14532)。
2024年10月,農(nóng)業(yè)農(nóng)村部印發(fā)《關于大力發(fā)展智慧農(nóng)業(yè)的指導意見》,進一步著重強調(diào)了開發(fā)智能設計育種工具,推進育種智能化進程的迫切性。基因組選擇(geomic selection,GS)作為分子育種的關鍵技術(shù)之一,其相關基礎研究是提高我國動植物設計育種水平的重大亟需。因此,開發(fā)一款具有普適性且預測精度高的GS工具對分子育種應用具有重要的理論與實踐意義。
本研究基于多種機器學習(ML)訓練方法,開發(fā)出一款融合模型“MFMGP”,能夠用于預測動植物育種群體的復雜農(nóng)藝性狀表型。MFMGP利用指數(shù)衰減權(quán)重的歸一化融合方法,通過為每個ML模型的預測結(jié)果分配權(quán)重,并對這些權(quán)重應用指數(shù)衰減,再通過歸一化這些權(quán)重計算模型預測結(jié)果的加權(quán)平均值,從而獲得最終的融合預測結(jié)果。為了測試MFMGP的預測效果,將其與7種常用的GS模型進行比較(傳統(tǒng)模型GBLUP、4種機器學習LightGBM、SVR、XGBoost和HGBoost以及2種深度學習DNNGP和DeepCCR),結(jié)合植物中數(shù)據(jù)集(水稻、棉花、小麥與玉米)和動物測試數(shù)據(jù)集(豬),證明MFMGP具有更高的預測精度和更好的穩(wěn)定性。同時發(fā)現(xiàn),基因型-環(huán)境相互作用影響預測結(jié)果的準確度,高遺傳力農(nóng)藝性狀往往具有較高的預測精度。特別在亞洲栽培稻中,無論是利用秈稻作為訓練群體預測粳稻亞群,或粳稻作為訓練群體預測秈稻亞群,其預測精度均較低,提示育種家應根據(jù)測試群體選擇合適的亞群構(gòu)建訓練群體。綜上,MFMGP可以顯著提高預測精度,縮短育種周期,降低育種成本,有望在動植物育種中具有更廣泛的應用。
該研究聯(lián)合了國內(nèi)多家科研單位,實現(xiàn)了動植物學科交叉攻關農(nóng)業(yè)“卡脖子難題”。未來,成果有望吸引更多科研單位和育種公司進一步進行實踐和應用,打造智能快速育種技術(shù)體系,助力我國分子育種技術(shù)邁向智能化、高效化發(fā)展的新階段。
安徽農(nóng)業(yè)大學農(nóng)學院青年教師張超普、華中農(nóng)業(yè)大學植物科學技術(shù)學院已畢業(yè)碩士梁齊齊、喻宇燁為本文的共同第一作者。安徽農(nóng)業(yè)大學農(nóng)學院黎珉副教授、華中農(nóng)業(yè)大學金雙俠教授、安徽農(nóng)業(yè)大學農(nóng)學院黎志康講席教授為本文的共同通訊作者。該研究得到了國家自然科學基金、安徽省自然科學基金、中國農(nóng)業(yè)科學院科技創(chuàng)新工程、南繁專項的共同資助。
