عنوان مقاله :
مقايسه روش هاي PCA و DAPC در تجزيه و تحليل ساختار جمعيتي گاوميشهاي ايران با تراشههاي اسنيپ K90
عنوان به زبان ديگر :
Comparison of PCA and DAPC methods for analysis of Iranian Buffalo population structure using SNPchip90k data
پديد آورندگان :
عزيزي، زهرا دانشگاه تبريز - دانشكدة كشاورزي - گروه علوم دامي , مرادي شهربابك، حسين دانشگاه تهران - پرديس كشاورزي و منابع طبيعي - گروه علوم دامي , مرادي شهربابك، محمد دانشگاه تهران - پرديس كشاورزي و منابع طبيعي - گروه علوم دامي
كليدواژه :
DAPC , PCA , گاوميش , ساختار جمعيتي , تراشههاي اسنيپ
چكيده فارسي :
اطلاع از ساختار ژنتيكي جمعيت دامها در راستاي اجراي بهتر برنامه هاي اصلاح نژادي و حفظ ذخاير ژنتيكي آنها بسيار ارزشمند است. دادههاي ژنگاني (ژنومي) فرصتي براي حل پيچيدگي تاريخچه تكاملي جمعيتها و بازسازي رويدادهاي تاريخي نادر، را فراهم مي آورند. در اين پژوهش براي ارزيابي ساختار جمعيتي گاوميشهاي ايران روشهاي تجزيه و تحليل مؤلفههاي اصلي (PCA) و تجزيه و تحليل جداسازي مؤلفههاي اصلي (DAPC) اجرا شد. از شمار 404 گاوميش از سه نژاد شمالي، آذري و خوزستاني خونگيري شد و تعيين ژنوتيپ با تراشههاي اسنيپ 90k توسط شركت پادانو در كشور ايتاليا انجام شد. نتايج بهدستآمده از تجزية مؤلفه هاي اصلي و تجزية جداسازي مؤلفه هاي اصلي، جداسازي سه نژاد را به خوبي نشان داد و هر دو تصوير آشكاري از ساختار ژنتيكي جمعيتهاي مورد بررسي را نشان دادند. در روش DAPC، براي ارزيابي شمار بهينه خوشه با معيار ارزيابي BIC، K=3 بهترين نتيجه را نشان داد. نتايج اعتبارسنجي متقابل براي نگهداشتن شمار مؤلفة اصلي بهينه براي تجزيه و تحليل تشخيصي، 50 مؤلفة اول MSE كمتري نسبت به مؤلفه هاي ديگر داشت. در اين بررسي روش DAPC احتمال عضويت افراد جمعيتها را با درستي 100 درصد پيشبيني كرد ولي روش PCA قادر به ارزيابي گروهها نبوده و براي به دست آوردن تصوير روشن از واريانس بين جمعيتها DAPC مناسبتر از PCA عمل ميكند. روش DAPC در بررسي ساختار جمعيتي نسبت به روش PCA به دليل افزايش واريانس بين گروه ها و كاهش واريانس درون گروه ها و همچنين ارائة تصوير آشكاري از ساختار جمعيتي كارآمد بود و مي تواند در كنترل كيفيت و تصحيح لايهبندي جمعيتي در بررسيهاي ارتباطي جايگزيني براي PCA باشد.
چكيده لاتين :
Understanding of population genetic structure is valuable for better implementation of breeding programs and most importantly, preservation of genetic resources. Genomic data provide an opportunity to consider complex evolutionary history of populations and reconstruct rare historical events. In this research, the structure of Iranian buffalo populations was studied by using principal component analysis and discriminant analysis principal component methods. For this purpose, the number of 404 buffalos from three breeds including North, Azari and Khozestani were sampled and genotyped by SNPChip 90k from Padano Company in Italy. The results of principal component analysis and discriminant analysis principal component showed a clear picture of the genetic structure of the studied populations. Assessing the optimal number of clusters with criteria BIC, K = 3 by the DAPC method showed the best results. The result of cross-validation for retaining principal components was optimized to 50 first components that showed the lowest MSE. In this study, DAPC predicted assignment of individuals to clusters and membership probabilities with 100% accuracy. PCA method was not able to provide a group assessment and DAPC method outperformed than PCA in achieving a clear variance difference between populations. DAPC method can be applied in quality control and stratification population correction of GWAS as an alternative to the PCA because of summarizing the genetic differentiation between groups and overlooking within-group variation and providing better population structure.
عنوان نشريه :
علوم دامي ايران
عنوان نشريه :
علوم دامي ايران