عنوان مقاله :
پيشگويي سميت و ضريب توزيع اكتانول-آب آفت كشهاي آلي كلردار با استفاده ازتوصيف گرهاي مولكولي و روشهاي الگوريتم ژنتيك و رگرسيون خطي چند متغيره
عنوان به زبان ديگر :
Prediction of toxicity and octanol – water partition coefficient of organochlorine pesticides using Molecular Descriptors and GAMLR Method
پديد آورندگان :
شفيعي، فاطمه فاقد وابستگي , زماني، زهرا دانشگاه آزاداسلامي - گروه شيمي،واحد اراك
كليدواژه :
سميت , ارتباط كمي ساختار- فعاليت , روش رگرسيون خطي چند متغيره , الگوريتم ژنتيك , آفت كشهاي آلي كلردار , ضريب توزيع اكتانول-آب
چكيده فارسي :
در اين تحقيق ازمطالعه ارتباط كمي ساختار- فعاليت (QSAR) جهت پيشگويي فعاليتهاي آفت كشهاي آلي كلردار استفاده شد. ابتدا به كمك نرمافزارگوس ويو 05 ساختار شيميايي تمام مولكولهاي مورد مطالعه رسم گرديد و سپس بهينه سازي با نرمافزار گوسين 09 و روش هارتري-فاك و سري پايه G* 31-6 انجام پذيرفت. خواص فيزيكي- شيميايي نظير سميت (logLD50) وضريب توزيع اكتانول-آب (logP) از منابع معتبر علمي به دست آورده شده است. براي تمامي سموم مورد مطالعه توصيفگرهاي مناسب با استفاده از نرمافزار دراگون و روش هاي الگوريتم ژنتيك و برگشتي تعيين شدند. سپس ارتباط بين توصيف گرهاي مولكولي و فعاليت ها با استفاده از روش چند متغيره خطي مورد بررسي قرار گرفت. به منظور ساخت و آزمون مدلهايQSAR داده ها به طور تصادفي به دو دسته :آموزشي (80 درصد ) و آزمون (20 درصد) تقسيم گرديدند. مدل ها با استفاده از ضرايب آماري نظير ضريب همبستگي(R)، مجذور آن (R2) و ريشه ميانگين مربع خطا RMSE) ) انتخاب شدند. براي بررسي توانايي پيش بيني و اعتبار مدل ها از اعتبار سنجي تقاطعي "يكي بيرون" و اعتبار سنجي خارجي استفاده شد. اعتبار سنجي خارجي با استفاده از ضرايب رگرسيوني مجموعه آزمون انجام گرديد. نتايج اعتبار سنجي و كيفيت بالاي ضرايب مدلها نشان ميدهد كه مدلهاي GA-MLR بهدست آمده مدلهاي قابل قبول QSAR مي باشند. اين مدل ها ميتوانند جهت شناسايي توصيف گرهاي مناسب و پيشگويي فعاليت هاي آنها به كار گرفته شوند.
چكيده لاتين :
In this research, Quantitative Structure–Activity Relationship (QSAR) studies have been used to predict activities of organochlorine pesticides. Firstly, the chemical structure of molecules was drawn with the Gauss view 05 program and optimized at Hartree–Fock level of theory and 6-31G* basis sets using Gaussian 09 software. The physiochemical properties namely octanol-water partition coefficient (logP) and toxicity (log LD50) are taken from the scientific web book. The dragon software has been used for the calculation of molecular descriptors. The suitable descriptors were selected with the aid of the genetic algorithm (GA) and backward techniques. At the next step, the relationship between molecular descriptors and the activities was investigated by multiple linear regression (MLR) method. In order to build and test QSAR models, a data set of organochlorine pesticides was randomly separated into 2 groups: training (80%) and test (20%) sets. The models were evaluated with regression parameters: correlation coefficient (R), squared regression coefficient (R2), adjusted correlation coefficient (R2 adj) and root mean squared error (RMSE). For the predictive ability and verification of the models are discussed by using Leave-One-Out (LOO)
cross-validation and external test set. The external prediction accuracy of the obtained models was examined using the above regression parameters. Results of validations and high statistical quality of models indicate that generated GA-MLR models are reasonable QSAR models. These models help to delineate the important descriptors responsible for predicting their activities.
عنوان نشريه :
تحقيقات حشره شناسي