عنوان مقاله :
بهينهسازي پارامترهاي روشهاي يادگيري ماشين بر ارزيابي ژنومي صفات گسسته دودويي با در نظر گرفتن ساختار جمعيت و توزيعهاي متفاوت فنوتيپ در جمعيت مرجع
پديد آورندگان :
نادري ، يوسف دانشگاه آزاد اسلامي واحد آستارا - باشگاه پژوهشگران جوان و نخبگان - گروه علوم دامي
كليدواژه :
اعتبارسنجي , صفات آستانهاي , عدم تعادل پيوستگي , وراثتپذيري , يادگيري ماشين
چكيده فارسي :
تنظيم اوليه و بهينهسازي پارامترهاي ورودي روشهاي يادگيري ماشين گامي اساسي جهت دستيابي به حداكثر صحت پيشبيني ژنومي ميباشد. در اين تحقيق، جمعيتهاي ژنومي براي سطوح مختلف وراثتپذيري (0.05 و 0.2)، عدم تعادل پيوستگي (پايين و بالا) و تعداد متفاوت جايگاه صفات كمي (200 و 600) بر روي 29 كروموزوم شبيهسازي شد. جهت ايجاد نسبتهاي مختلف فنوتيپ آستانهاي دودويي، فنوتيپ افراد جمعيت مرجع وابسته به اينكه باقيمانده آنها كمتر از ē1SDe (رويكرد اول) يا 50 درصد افراد جمعيت (رويكرد دوم) باشد كد يك (فنوتيپ نامطلوب) و ساير حيوانات كد صفر (فنوتيپ مطلوب) اختصاص داده شد. براي بهينهسازي پارامترهاي ورودي مدل، سطوح مختلف تعداد SNP نمونهگيريشده (100، 1000 و 2000=mtry)، تعداد بوت استراپ (500، 1000 و 2000=ntree) و حداقل اندازه گره پاياني (1 و 5=node size) براي جنگل تصادفي و سطوح مختلف تعداد درخت (100، 1000 و 2000=ntree)، عمق درخت (1، 5 و 10=tc) و نرخ يادگيري (0.1 و 0.05=lc) براي Boosting در نظر گرفته شد. كمترين ميزان خطاي خارج از كيسه براي mtry برابر با 2000، ntree برابر با 1000 و node size برابر با 1 و كمترين خطاي اعتبارسنجي در روش Boosting براي ntree، tc و lr به ترتيب 1000، 10 و 0.05 مشاهده شد. صحت پيشبيني ژنومي روشهاي جنگل تصادفي و Boosting با كاهش فنوتيپ نامطلوب (رويكرد اول) افزايش يافت. بطور كلي در تمام سناريوها روش Boosting عملكرد بهتري نسبت به روش جنگل تصادفي داشت كه دليل اين امر را ميتوان لحاظ كردن اثرات متقابل بين نشانگرها، خود ترميمي و قدرت بالاي اين روش در كاهش خطاي مدل دانست.
عنوان نشريه :
پژوهشهاي علوم دامي ايران
عنوان نشريه :
پژوهشهاي علوم دامي ايران