شماره ركورد :
1172384
عنوان مقاله :
بهبود استنتاج شبكه‌هاي تنظيم بيان ژن با رويكرد تجميع داده‌ها
عنوان به زبان ديگر :
Improving the Inference of Gene Expression Regulatory Networks with Data Aggregation Approach
پديد آورندگان :
ناصري، عاطفه دانشگاه الزهرا (س) - دانشكده فني مهندسي - گروه مهندسي كامپيوتر، تهران , هاشمي نژاد، محمدحسين دانشگاه الزهرا (س) - دانشكده فني مهندسي - گروه مهندسي كامپيوتر، تهران , شرقي، مهران دانشگاه الزهرا (س) - دانشكده فني مهندسي - گروه مهندسي كامپيوتر، تهران
تعداد صفحه :
13
از صفحه :
201
از صفحه (ادامه) :
0
تا صفحه :
213
تا صفحه(ادامه) :
0
كليدواژه :
شبكه تنظيم بيان ژن , استنتاج شبكه تنظيم بيان ژن , الگوريتم انتشار , ادغام داده‌ها
چكيده فارسي :
مقدمه: عمده‌ترين موضوع بر سر راه آينده بيوانفورماتيك طراحي ابزارهايي جهت مشخص كردن عملكردها و تمامي محصولات ژن‌هاي يك سلول است. اين امر نياز به ادغام رشته‌هاي متفاوت بيولوژيكي و همچنين ابزارهاي پيچيده رياضي و آمار دارد. در اين تحقيق نشان داده ­شد كه مي­توان با استفاده از تكنيك ­هاي داده ­كاوي مدل­ هايي براي تشخيص سبك زندگي افراد از لحاظ پرخطر يا كم ­خطر بودن براي ابتلاء به سرطان روده بزرگ توسعه داد. روش: در اين بررسي گذشته­ نگر، مجموعه­ داده­اي شامل 84 فرد بيمار و 225 فرد سالم، شامل 25 خصيصه جمع‌آوري شد. اين اطلاعات شامل بيماراني است كه تشخيص آن­ها مربوط به سال­هاي 1385 تا سه ماهه اول 1393 مي­باشد. از پركاربردترين تكنيك ­ها در ادبيات انفورماتيك پزشكي شامل ماشين بردار پشتيبان، بيزين ساده، درخت تصميم و نزديك‌ترين همسايگي براي توسعه مدل­ ها استفاده شد. نتايج: مدل­ هاي توسعه داده شده با كارايي قابل قبولي، قادر به تشخيص سبك زندگي افراد هستند. سنجه غيرتكنيكي توسعه داده شده به خوبي مي­تواند ارزش واقعي تك‌تك پيش­بيني­ ها، چه درست و چه نادرست را با هزينه­ هاي واقعي مشخص كند و يك ميزان واقعي از هزينه­ هاي صرفه­ جويي شده در نظام سلامت توسط هر مدل را نشان دهد. از ميان مدل­ هاي توسعه داده شده تنها دو مدل توانست معيارهاي تعيين شده جهت استفاده در دنياي واقعي را ارضا كند. نتيجه­ گيري: مدل ­هاي توسعه داده شده نه تنها بايد از لحاظ تكنيكي ارزيابي شوند، بلكه بايد از لحاظ سنجه­ هاي مورد پذيرش براي حوزه پزشكي و همچنين قابليت اجرا براي حل واقعي مسئله نيز بررسي گردند.
چكيده لاتين :
Introduction: The major issue for the future of bioinformatics is the design of tools to determine the functions and all products of single-cell genes. This requires the integration of different biological disciplines as well as sophisticated mathematical and statistical tools. This study revealed that data mining techniques can be used to develop models for diagnosing high-risk or low-risk lifestyles for colorectal cancer. Method: In this retrospective study, a dataset consisting of information relevant to 84 patients and 225 healthy individuals with 25 attributes was collected. This information was on patients diagnosed from 2006 to the first quarter of 2014. The most widely used techniques in the medical informatics literature including support vector machine, Naive Bayes, decision tree, and k-nearest neighbor were used to develop the models. Results: The developed models are able to distinguish people's lifestyles efficiently. A welldeveloped non-technical measure can properly determine the true value of individual predictions, whether true or false, at actual costs, and indicate a true measure of the cost savings in the health system by each model. Among the developed models, only two models were able to meet the criteria set for use in the real world. Conclusion: The developed models should not only be technically evaluated, but should also be examined in terms of metrics accepted for the medical field as well as feasibility for real problem solving.
سال انتشار :
1399
عنوان نشريه :
مجله انفورماتيك سلامت و زيست پزشكي
فايل PDF :
8207832
لينک به اين مدرک :
بازگشت