Title of article :
Propensity based classification: Dehalogenase and non-dehalogenase enzymes
Author/Authors :
Satpathy، R نويسنده School of Life Sciences, Sambalpur University, Burla, Sambalpur, India. , , Konkimalla ، V. B نويسنده Department of Biological Sciences, National Institute of Science Education & Research (NISER), Bhubaneswar, India , , Ratha ، J نويسنده School of Life Sciences, Sambalpur University, Burla, Sambalpur, India ,
Issue Information :
دوفصلنامه با شماره پیاپی 0 سال 2015
Pages :
7
From page :
209
To page :
215
Abstract :
اين پژوهش براي طبقه بندي و تمايز بين آنزيم دهالوژناز و غير دهالوژناز با در نظر گرفتن ميل تركيبي اسيد آمينه در هسته، سطح و هر دو قسمت طراحي شده است. مجموعه داده به صورت فردي با انتخاب ساختارهاي سه بعدي از پروتيين موجود در بانك اطلاعات پروتيين (PDB) ساخته شده است. اين صورت پيش بيني از اسيدهاي آمينه هسته اي توسط ابزار IPFP پيش بيني شده بود و محاسبه ميل تركيبي ساختاري آنها توسط يك نرم افزار داخلي براي محاسبه ميل تركيبي كه به صورت آنلاين در دسترس است انجام شد. همه مجموعه داده در نهايت با استفاده از بيزين، J-48، جنگل هاي تصادفي، خوشه-بندي كا-ميانگين و الگوريتم دسته بندي SMO به دو دسته تقسيم مي شود كه دهالوژناز و غير دهالوژناز ناميده مي شوند. با ايجاد مقايسه روش هاي مختلف طبقه بندي، روش درخت پيشنهاد شده (جنگل تصادفي) با دقت طبقه بندي 98.88? (حداكثر) براي مجموعه داده متمايل هسته به خوبي انجام شد. بنابراين، پيشنهاد مي شود كه، ميل تركيبي هسته اسيد آمينه مي تواند به عنوان يك توصيفگر بالقوه جديد براي طبقه بندي آنزيم ها مورد تاييد باشد.
Abstract :
The present work was designed to classify and differentiate between the dehalogenase enzyme and non–dehalogenases (other hydrolases) by taking the amino acid propensity at the core, surface and both the parts. The data sets were made on an individual basis by selecting the 3D structures of protein available in the PDB (Protein Data Bank). The prediction of the core amino acids were predicted by IPFP tool and their structural propensity calculation was performed by an in-house built software, Propensity Calculator which is available online. All datasets were finally grouped into two categories, namely dehalogenase and non-dehalogenase using Naïve Bayes, J-48, Random forest, K-means clustering, and SMO classification algorithm. By making the comparison of various classification methods, the proposed tree method (Random forest) performs well with a classification accuracy of 98.88 % (maximum) for the core propensity data set. Therefore, we proposed that, the core amino acid propensity could be approved as a novel potential descriptor for the classification of enzymes.
Journal title :
Journal of Artificial Intelligence and Data Mining
Serial Year :
2015
Journal title :
Journal of Artificial Intelligence and Data Mining
Record number :
2387996
Link To Document :
بازگشت