شماره ركورد :
1158258
عنوان مقاله :
بهينه‌سازي پارامترهاي روش‌هاي يادگيري ماشين بر ارزيابي ژنومي صفات گسسته دودويي با در نظر گرفتن ساختار جمعيت و توزيع‌هاي متفاوت فنوتيپ در جمعيت مرجع
پديد آورندگان :
نادري ، يوسف دانشگاه آزاد اسلامي واحد آستارا - باشگاه پژوهشگران جوان و نخبگان - گروه علوم دامي
از صفحه :
113
تا صفحه :
124
كليدواژه :
اعتبارسنجي , صفات آستانه‌اي , عدم تعادل پيوستگي , وراثت‌پذيري , يادگيري ماشين
چكيده فارسي :
تنظيم اوليه و بهينه‌سازي پارامترهاي ورودي روش‌هاي يادگيري ماشين گامي اساسي جهت دستيابي به حداكثر صحت پيش‌بيني ژنومي مي‌باشد. در اين تحقيق، جمعيت‌هاي ژنومي براي سطوح مختلف وراثت‌پذيري (0.05 و 0.2)، عدم تعادل پيوستگي (پايين و بالا) و تعداد متفاوت جايگاه صفات كمي (200 و 600) بر روي 29 كروموزوم شبيه‌سازي شد. جهت ايجاد نسبت‌هاي مختلف فنوتيپ آستانه‌اي دودويي، فنوتيپ افراد جمعيت مرجع وابسته به اينكه باقي‌مانده آنها كمتر از ē1SDe (رويكرد اول) يا 50 درصد افراد جمعيت (رويكرد دوم) باشد كد يك (فنوتيپ نامطلوب) و ساير حيوانات كد صفر (فنوتيپ مطلوب) اختصاص داده شد. براي بهينه‌سازي پارامترهاي ورودي مدل، سطوح مختلف تعداد SNP نمونه‌گيري‌شده (100، 1000 و 2000=mtry)، تعداد بوت استراپ (500، 1000 و 2000=ntree) و حداقل اندازه گره پاياني (1 و 5=node size) براي جنگل تصادفي و سطوح مختلف تعداد درخت (100، 1000 و 2000=ntree)، عمق درخت (1، 5 و 10=tc) و نرخ يادگيري (0.1 و 0.05=lc) براي Boosting در نظر گرفته شد. كمترين ميزان خطاي خارج از كيسه براي mtry برابر با 2000، ntree برابر با 1000 و node size برابر با 1 و كمترين خطاي اعتبارسنجي در روش Boosting براي ntree، tc و lr به ترتيب 1000، 10 و 0.05 مشاهده شد. صحت پيش‌بيني ژنومي روش‌هاي جنگل تصادفي و Boosting با كاهش فنوتيپ نامطلوب (رويكرد اول) افزايش يافت. بطور كلي در تمام سناريوها روش Boosting عملكرد بهتري نسبت به روش جنگل تصادفي داشت كه دليل اين امر را مي‌توان لحاظ كردن اثرات متقابل بين نشانگرها، خود ترميمي و قدرت بالاي اين روش در كاهش خطاي مدل دانست.
عنوان نشريه :
پژوهشهاي علوم دامي ايران
عنوان نشريه :
پژوهشهاي علوم دامي ايران
لينک به اين مدرک :
بازگشت