Other language title :
آيا شباهت پروتئيني فاكتور هاي پرتواني به مفهوم شباهت معنايي ژن آنتولوژي آنهاست؟
Title of article :
Does Protein Similarity of Pluripotency Factors Mean Their Gene Ontology Semantic Similarity?
Author/Authors :
Majidzadeh Heravi, Reza Department of Animal Science - Faculty of agriculture - Ferdowsi university of Mashhad, Mashhad, Iran , Qayoomian, Mohsen Department of Biology - Faculty of Science - Ferdowsi university of Mashhad, Mashhad, Iran , Hashemi Attar, Morteza Department of Animal Science - Faculty of agriculture - Ferdowsi university of Mashhad, Mashhad, Iran
Abstract :
Recognition and prediction of biological function of proteins based on amino acid sequences
is a simple method employed in so many software and operators. However, the sequence
similarity does not always imply to similarity of biological function. The aim of this study
was to determine the semantic similarity of gene ontology (GO) of six pluripotency factors,
Oct4, Sox2, C-Myc, Klf-4, Lin28 and Nanog in six species and evaluate their conformity
with their protein sequence similarity and phylogenetic distance. C-myc factor exhibited a
significant correlation between phylogenetic distance and protein similarity. The other
factors like Sox2, Klf-4 and Lin-28 showed the correct changes of phylogenetic distance and
protein similarity, but Nanog and Oct4 factors did not display a correct correlation between
two indices because, the increase of protein similarity was not followed with the decrease of
phylogenetic distance. Following the study, the protein or nucleotide similarity was assumed
as dependent variable and GO similarity in three categories of biological process (BP),
molecular function (MF) and, cell component (CC) were expected as the independent
variables. With this assumption, regression analysis was accomplished to determine the best
model for protein and nucleotide similarity estimation. The protein or nucleotide similarity
also displayed a significant regression with GO similarity for C-myc factor and category of
BP and CC were selected to estimate protein or nucleotide similarity by model, but a
significant regression was not observed for other pluripotency factors for estimation of
protein or nucleotide similarity. It means that except of C-myc, GO similarity of other studied
pluripotency factors didn’t reflect the protein or nucleotide similarity. It is suggested that
related data for five pluripotency factors, including Oct-4, Sox2, Klf4, Lin28 and Nanog in
the six studied species should be reviewed.
Farsi abstract :
شناخت اعمال بيولوژيكي پروتئينها بر اساس ترتيب اسيد آمينه ها يك روش ساده اي است كه در خيلي از نرم افزارها و همچنين توسط بزوتران بكار گرفته مي شود. اگرچه شباهت ترتيب اسيد آمينه اي پروتئينها بر شباهت عمل زيستي آنها دلالت دارد. هدف از اين مطالعه تعيين شبعت ژن أولوژي شش فاكتور پرتواني Lin28 Klf
- 4 ، C - My Sox2 Oct4 و Nanog در شت گونه و ارزيابي تطابق آنها با شباهت سكانس پروتئيني و فاصله فيلوژي بود. فاكتور پرتواني C-myc همبستگي معني داري را بين فاصله فيلوژي و شباهت پروتئيني ارائه داد. ديگر فاكتورها مانند K1f4 Sox2 و Lin28 تغييرات صحيح رابطه فيلوژي و شباهت پروتئيني را نشان دادند اما Oct4 و Nanog ارتباط صحيحي را بين دو شخص ارائه نداديد چون با افزايش شباهت پروتئيني رابطه فيلوژي كمتر شد. در ادامه آزمايش شبعت پروتئيني و يا دوكلوئيدي بعنوان متغير مستقل و شبهت زن آنولوژي در سه شاخه مرحله بيولوژيك (BP)، عمل مولكولي (MIF) و جزء سلولي (CC) بعنوان متغير وابسته فرض شد. با اين فرض آناليز رگرسيون بهترين مدل را براي تخمين شبهت پروتئيني و نوكلئوتيدي ارائه داد. رگرسيون شبعت پروتئيني با نوكلئوتيدي با شباهت آنولوژي براي فاكتور C-myc معني دار بود و شب همه شاخه هاي BP و CC براي تخمين شباهت پروتئيني و يا نوكلئوتيدي توسط مدل انتخاب شدند، اما براي ساير فاكتور هاي برتواي رگرسيون معني داري براي تخمين شباهت پروتئيني يا نوكلئوتيدي مشاهده متد اين نتايج نشان مي دهد كه براي فاكتورهاي برتواي مورد مطالعه به غير از C-myc از روي شباهت آنتولوژي نمي توان شباهت سكانس بروتئيني يا نوكلئوتيدي رانتيجه گيري كرد.
Keywords :
Similarity , Protein , Pluripotency , Phylogeny , Gene ontology