عنوان مقاله :
ارزيابي صحت پيشبيني ژنومي در معماريهاي مختلف ژنومي صفات كمي و آستانهاي با جانهي دادههاي ژنومي شبيهسازيشده، توسط روش جنگل تصادفي
عنوان به زبان ديگر :
Evaluation of Genomic Prediction Accuracy in Different Genomic Architectures of Quantitative and Threshold Traits with the Imputation of Simulated Genomic Data using Random Forest Method
پديد آورندگان :
نادري، يوسف دانشگاه آزاد اسلامي - واحد آستارا
كليدواژه :
عدم تعادل پيوستگي , صفات آستانهاي , يادگيري ماشيني , جانهي , معماري ژنومي
چكيده فارسي :
گزينش ژنومي چالشي اميدبخش براي كشف رموز ژنتيكي صفات كمي و كيفي بهمنظور بهبود رشد ژنتيكي و صحت پيشبيني ژنومي در اصلاح دام ميباشد. بهعلت ناخوانا بودن نسبتي از ژنوتيپها، پيشبيني دقيق صحت ژنومي نيازمند برآورد اين نشانگرها از طريق جانهي مي باشد. در نتيجه هدف اين تحقيق برآورد صحت جانهي و عوامل مؤثر برآن و ارزيابي صحت ژنومي روش جنگل تصادفي در براي معماري هاي مختلف ژنومي براي آناليز صفات كمي و آستانهاي دودويي بود. در فاز اول، داده هاي ژنومي از طريق نرم افزار QMSim با سطوح متفاوت وراثتپذيري (05/0 و 25/0)، سطوح مختلف LD (كم و زياد) و تراكمهاي متفاوت جايگاههاي صفات كمي (96 و 960) و تعداد 48 كروموزم شبيهسازي شدند. در فاز دوم، براي شبيه سازي شرايط واقعي، بطور تصادفي اقدام به حذف (50 و 90 درصد) برخي نشانگر نموده و در مرحله بعد از طريق نرم افزار Flmpute اقدام به جانهي و پيشبيني نقاط گم شده نموده و صحت جانهي مورد ارزيابي قرار گرفت. در فاز سوم، دادهاي اصلي و جانهي با استفاده از روش جنگل تصادفي جهت ارزيابي صحت ژنومي صفات كمي و آستانهاي استفاده شدند. نتايح نشان داد كه با افزايش سطح LD صحت جانهي بهبود مييابد. با افزايش نسبت حذف نشانگرها (90 درصد)، اثر صحت جانهي بر صحت پيشبيني ژنومي پررنگتر بود. در صفات آستانهاي، سناريوي با حد بالاي QTL، LD و وراثتپذيري و در صفات پيوسته، سناريوي با حد بالاي LD و وراثتپذيري و حد پايين QTL بيشترين صحت پيشبيني ژنومي را در روش جنگل تصادفي به خود اختصاص دادند. بهطور كلي عملكرد روش جنگل تصادفي در برآورد صحت ژنومي صفات آستانهاي نسبت به صفات كمي بهتر بود.
چكيده لاتين :
Genomic selection is a promising challenge for discovering genetic variants influencing quantitative and threshold traits for improving the genetic gain and accuracy of genomic prediction in animal breeding. Since a proportion of genotypes are generally uncalled, therefore, prediction of genomic accuracy requires imputation of missing genotypes. The objectives of this study were (1) to quantify imputation accuracy and to assess the factors affecting it; and (2) to evaluate the genomic accuracy of random forest (RF) algorithm to analyze binary threshold and quantitative traits. In the first phase, genomic data were simulated by QMSim software to reflect variations in heritability (h2 = 0.05 and 0.25), number of QTL (QTL=96 and 960) and linkage disequilibrium (LD=low and high) for 48 chromosomes. In the second phase, for real condition simulating, we randomly masked markers with 50% and 90% missing rate for each scenario; afterwards, hidden markers were imputed using FImpute software, and estimated imputation accuracy. In the third phase, to estimate genomic breeding values, we applied Random forest algorithm for original (before masking a proportion of SNPs) and imputed genotypes with quantitative and quality phenotypes. The accuracy of imputation was improved with increasing level of LD. With increase a major proportion of masked markers (90%), results of current study shed light on the effects of imputation accuracy on accuracy of genomic prediction. In the scenario combining the highest heritability, LD and QTL for threshold traits and in the scenario combining the highest heritability and LD and the least QTL for quantitative traits, random forest method had the best performance of genomic accuracy. Generally, accuracy of genomic prediction for threshold traits had more precise than quantitative trait when using the random forest method.
عنوان نشريه :
پژوهشهاي توليدات دامي
عنوان نشريه :
پژوهشهاي توليدات دامي