شماره ركورد كنفرانس :
4155
عنوان مقاله :
انتخاب متغير و پيشگويي در دادههاي بزرگ توسط يك روش غيرخطي
پديدآورندگان :
محبي محبوبه M.Mohebbi@shahroodut.ac.ir دانشگاه صنعتي شاهرود , شاهسوني داود dshahsavani@shahroodut.ac.ir دانشگاه صنعتي شاهرود
كليدواژه :
انتخاب متغير , رگرسيون ناپارامتري , رگرسيون خطي موضعي , اعتبار سنجي تقاطعي
عنوان كنفرانس :
اولين همايش ملي روشهاي مدرن در قيمت گذاري هاي بيمه اي و آمارهاي صنعتي
چكيده فارسي :
تحليل داده هاي با بعد بالا در همه ي زمينه هاي مختلف علوم، صنعتي و تجاري، همواره با چالش انتخاب متغيرهاي مهم روبهرو است. روش هاي متداول انتخاب متغير مبتني بر ساختارهاي خطي هستند، اما در بسياري از موارد و در بعد بالا ممكن است ارتباط ساختاري متغير پاسخ و متغيرهاي توضيحي خطي نباشد. همچنين اين روش ها، متغير هايي را كه به تنهايي تاثير ناچيزي بر متغير پاسخ دارند، اما در تركيب با ساير متغير ها كه براي پيشگويي ممكن است مفيد باشند را ناديده ميگيرند. در اين پژوهش با ارائه الگوريتمي چند مرحله اي مبتني بر رگرسيون موضعي خطي، متغير هاي مهم در قالب اثرات متقابل تاثيرگذار، شناسايي و انتخاب شده و مدل پيشگويي برازش مي شود. بررسيهاي انجام شده با دادههاي واقعي در صنعت دارويي نشان از كارآمدي الگوريتم در فضاي متغير هاي توضيحي با بعد بالا است.