شماره ركورد كنفرانس :
4117
عنوان مقاله :
قطعه بندي زماني ويديوها بر اساس اعمال مختلف انسان به كمك مدل پنهان ماركوف
پديدآورندگان :
رستگار مصطفي كارشناس ارشد هوش مصنوعي، دانشكده مهندسي و علوم كامپيوتر، دانشگاه شهيد بهشتي، تهران , علي آئين احمد استاديار، هوش مصنوعي، دانشكده مهندسي و علوم كامپيوتر، دانشگاه شهيد بهشتي، تهران
كليدواژه :
تشخيص اعمال انسان , نقاط موثر , كيسه ي لغات تصويري , بردار فيشر , قطعه بندي زماني , مدل پنهان ماركوف
عنوان كنفرانس :
دومين كنفرانس ملي پژوهش هاي نوين در مهندسي برق و كامپيوتر
چكيده فارسي :
تحليل ويديوها و تشخيص اعمالي كه در يك ويديو درحال انجام است، يكي از چالش هاي پركاربرد در مقوله ي بينايي ماشين مي باشد كه در سيستم هاي مختلف نظير نظارت بر رفتارهاي مشكوك فرودگاه ها يا موزه ها، ربات هاي در تعامل با انسان و غيره استفاده مي شود. در اين مسئله با يك ويديو كه حاوي يك يا چند عمل مي باشد، سروكار داريم. روش هاي نوين تشخيص عمل عمدتا بر اساس شناسايي نقاط موثر در ابعاد مكاني و زماني مي باشند به اين صورت كه به جاي آن كه تمامي پيكسل هاي تصاوير يك ويديو مورد بررسي قرار گيرد، با بررسي الگوهاي اين نقاط كه به وسيله ي توصيف گرهايي نظير كيسه ي لغات تصويري يا بردار فيشر توصيف مي شوند، به تصميم گيري در مورد نوع عمل مي-پردازند. جهت تشخيص اعمال مختلف در ويديوهاي طولاني تر مي توان از يك راهكار عمومي استفاده كرد به اين صورت كه ابتدا قطعه بندي در بعد زمان انجام دهيم به اين صورت كه در هر كليپ (قطعه ) مطمئن باشيم تنها يك عمل درحال انجام مي باشد. سپس مراحل لازم را جهت تشخيص برروي آن اعمال مي شود. اما سوال اينجاست كه چگونه مي-توان بدون تشخيص عمل، فريم هاي مرزي را براي هر عمل شناسايي كرد. دراين مقاله يك روش ابتكاري معرفي مي گردد كه درآن طراحي خاصي از مدل پنهان ماركوف معرفي گرديده و به كمك آن مي توان به تشخيص فريم هاي مرزي كليپ از روي ويديوهاي طولاني پرداخت.