شماره ركورد كنفرانس :
4386
عنوان مقاله :
جانهي مقادير گمشده با استفاده از روش رگرسيون انقباضي در داده ريزآرايه
پديدآورندگان :
مسلمي اعظم دانشجوي دكتري رشته آمارزيستي، گروه آمارزيستي، دانشكده پيراپزشكي، دانشگاه علوم پزشكي شهيد بهشتي، تهران، ايران , علوي مجد حميد استاد، گروه آمارزيستي، دانشكده پيراپزشكي، دانشگاه علوم پزشكي شهيد بهشتي، تهران، ايران , باغستاني احمدرضا استاديار، گروه آمارزيستي، دانشكده پيراپزشكي، دانشگاه علوم پزشكي شهيد بهشتي، تهران، ايران , عمراني ميرداود استاد، گروه ژنتيك و بيولوژي مولكولي، دانشكده پيراپزشكي، دانشگاه علوم پزشكي شهيد بهشتي، تهران، ايران
كليدواژه :
جانهي , گمشده , ريزآرايه , رگرسيون , برآورد انقباضي.
عنوان كنفرانس :
اولين كنفرانس ملي يافته هاي نوين در زيست شناسي
چكيده فارسي :
تكنيــك ريزآرايــه، ابــزاري مفيــد و مهــم در تحقيقــات پزشــكي اســت. بــا گذشــت دو دهــه از توليــد ايــن تكنولــوژي، بيــش از 90% ژنهــاي موجــود در داده ريزآرايــه، شــامل مقــدار گمشــده هســتند. بــرآورد نادرســت مقاديــر گمشــده، موجــب كاهــش تــوان الگوريــت هــاي تحليــل، در داده ريزآرايــه مــي شــود. روش هــاي مختلفــي، بــراي بــرآورد داده هــاي گمشــده وجــود دارنــد. در ميــان آنهــا، روش هــاي رگرســيوني، از جملــه روش جانهــي حداقــل مربعــات مكانــي )LLSimpute(، نســبته بــه ديگــر روش هــا عملكــرد بهتــري دارنــد. بــراي بهبــود بيشــتر عملكــرد LLSimpute، روش جانهــي حداقــل مربعــات مكانــي انقباضــي )Shrinkage LLSimpute( مطــرح شــد. Shrinkage LLSimpute، همبســتگي بيــن داده هــاي ريزآرايــه را در نظــر گرفتــه و ژن هــاي مشــابه بــا ژن داراي مقــدار گمشــده را، از طريــق ضريــب همبســتگي پيرســون انتخــاب مــي كنــد. ايــن روش، بــه منظــور تعديــل ضرايــب مــدل رگرســيون، اصــل حداقــل مربعــات را بــا بــرآورد انقباضــي تركيــب كــرده، ســپس ضرايــب جديــد را، بــراي بــرآورد مقاديــر گمشــده بــه كار مــي بــرد. نتايــج نشــان داد،Shrinkage LLSimpute ، بــرآورد دقيــق تــري، از روش LLSimpute ، بــر داده ريزآرايــه (هموســتاز روي، ليونــز و همــكاران، 2000) بدســت مــي دهــد. بــرآورد مقاديــر گمشــده يــك گام پيــش آمــاده ســازي مهــم، در تحليــل داده هــاي ريزآرايــه اســت، زيــرا بســياري از روشــهاي تحليلــي ماننــد خوشــه بنــدي ژنــي و شــبكه ژنــي، مجموعــه داده كامــل لازم دارنــد. بنابرايــن يافتــن روشــي دقيــق و كارا، بــراي بــرآورد داده هــاي گمشــده ضــروري اســت. از آنجــا كــهshrinkage LLSimpute ، بــرآوردي دقيــق بــراي مقاديــر گمشــده بدســت مــي دهــد، جايگزيــن مناســبي بــراي LLSimputeاســت.