Author/Authors :
EGHBAL G. MANSOORI، EGHBAL G. MANSOORI نويسنده COMPUTER SCIENCE AND ENGINEERING DEPARTMENT, COLLEGE OF ENGINEERING, SHIRAZ UNIVERSITY, SHIRAZ, IRAN , , MANSOOR J. ZOLGHADRI، MANSOOR J. ZOLGHADRI نويسنده COMPUTER SCIENCE AND ENGINEERING DEPARTMENT, COLLEGE OF ENGINEERING, SHIRAZ UNIVERSITY, SHIRAZ, IRAN , , SERAJ D. KATEBI، SERAJ D. KATEBI نويسنده COMPUTER SCIENCE AND ENGINEERING DEPARTMENT, COLLEGE OF ENGINEERING, SHIRAZ UNIVERSITY, SHIRAZ, IRAN , , HASSAN MOHABATKAR، HASSAN MOHABATKAR نويسنده BIOLOGY DEPARTMENT, COLLEGE OF SCIENCE, SHIRAZ UNIVERSITY, SHIRAZ, IRAN , , REZA BOOSTANI، REZA BOOSTANI نويسنده COMPUTER SCIENCE AND ENGINEERING DEPARTMENT, COLLEGE OF ENGINEERING, SHIRAZ UNIVERSITY, SHIRAZ, IRAN , , MOHAMMAD H. SADREDDINI,، MOHAMMAD H. SADREDDINI, نويسنده COMPUTER SCIENCE AND ENGINEERING DEPARTMENT, COLLEGE OF ENGINEERING, SHIRAZ UNIVERSITY, SHIRAZ, IRAN. ,
Abstract :
در اين مقاله، توليد يك سري قوانين تفسيرپذير فازي جهت انتساب توالي اسيدهاي آمينه به دستههاي مناسب پروتييني بحث شده است. بدليل اهميت تفسيرپذيري قوانين در اين سيستم كلاسهبند، از توزيع اسيدهاي آمينه در توالي پروتيينها به عنوان ويژگي استفاده شده كه نشان دهنده احتمال رخداد شش گروه مبادلهاي از اسيدهاي آمينه در تواليهاست. براي توليد قوانين فازي از نسخه اصلاح شده يك روش مرسوم استفاده شده تا قوانيني ساده و قابل فهم (بويژه براي زيست شناسان) توليد شوند. جهت ارزيابي قوانين توليدي، چهار دسته پروتييني از پايگاه داده UniProt استخراج شده و سيستم كلاسهبند فازي روي آنها آزمايش شده است. نتايج آزمايشات نشان ميدهد كه قوانين توليدي ساده و قابل فهم بوده و از دقت مناسبي در مقايسه با ديگر روشهاي كلاسهبندي برخوردارند.
Abstract :
This paper considers the generation of some interpretable fuzzy rules
for assigning an amino acid sequence into the appropriate protein superfamily.
Since the main objective of this classifier is the interpretability of rules, we have
used the distribution of amino acids in the sequences of proteins as features.
These features are the occurrence probabilities of six exchange groups in the
sequences. To generate the fuzzy rules, we have used some modified versions of
a common approach. The generated rules are simple and understandable,
especially for biologists. To evaluate our fuzzy classifiers, we have used four
protein superfamilies from UniProt database. Experimental results show the
comprehensibility of generated fuzzy rules with comparable classification
accuracy.