شماره ركورد كنفرانس :
4330
عنوان مقاله :
شناسايي حالت دست در ويدئو با يادگيري عميق
پديدآورندگان :
جاماسب خلاري مهدي jamasb@stu.yazd.ac.ir دانشگاه يزد , درهمي ولي vderhami@yazd.ac.ir دانشگاه يزد
كليدواژه :
تشخيص حالت دست , يادگيري عميق , يادگيري شبكه عميق كانولوشني
عنوان كنفرانس :
هفدهمين كنفررانس ملي سيستم هاي فازي، پانزدهمين كنفرانس ملي سيستم هاي هوشمند و ششمين كنگره ملي مشترك سيستم هاي فازي و هوشمند ايران
چكيده فارسي :
تشخيص حالت دست از روي تصاوير استخراج شده از دوربين نيازمند استفاده از انواع روشهاي پردازش تصوير مناسب است تا با بهترين كيفيت حالت دست را تشخيص داد. در اين مقاله مسئله بهصورت يك مسئله طبقهبندي تعريف شده است كه تصاوير حالت دست به عنوان نمونههاي ورودي در سيستم است و شماره حالتهاي دست به عنوان خروجي است. هدف اين است كه مدلي را بيابيم كه بتواند به بهترين شكل اين پيشبيني را انجام دهد. براي اين كار بايد با استفاده از چندين نمونه آموزشي مدل را آموزش داد و از آن پس با استفاده از مدل به پيشبيني طبقه هر ويدئو پرداخت. با توجه به اينكه ابعاد ورودي اين ويدئوها بسيار زياد است بايد مدل ارائه شده بتواند با ابعاد بسيار بالا داده كار كند. ازاينرو در اين مقاله از يادگيري عميق جهت خلاصهسازي تصاوير و طبقهبندي آنها استفاده شده است. بهترين يادگيري عميقي كه براي استفاده در تصاوير و ويدئوها مورد استفاده قرار گرفته است يادگيري شبكه عميق كانولوشني است. نتايج تجربي به دست آمده نيز بهخوبي اين موضوع كه يادگيري شبكه عميق كانولوشني بهترين روش استخراج ويژگي از تصاوير و طبقهبندي آنها است را نشان ميدهد. در مجموعه داده كمبريج كه به همين منظور طراحي شده است روش پيشنهادي توانسته است به دقت 25/89 درصد و 50/88 درصد برسد كه تا 3 درصد از بهترين روشها بيشتر است.