شماره ركورد كنفرانس :
3364
عنوان مقاله :
بقاي عامل ها در سيستم هاي چند عاملي بر مبناي مدل فضاي قندي با استفاده از يادگيري تقويتي
پديدآورندگان :
سعيدي نعمت اله , نورافزا نسيم
كليدواژه :
جامعه مصنوعي , الگوريتم Q-,Learning مدل فضاي قندي , سيستم چند عاملي , يادگيري تقويتي
عنوان كنفرانس :
كنفرانس بين المللي پژوهش هاي نوين در علوم مهندسي
چكيده فارسي :
جامعه مصنوعي ساختار رفتارهاي گروهي افرادي است كه در اثر تعاملي كه با محيط پيرامون خود تحت قوانين خاصي دارند به وجود مي آيد . انسانها نيز از طريق تعاملي كه با يكديگر و جامعه دارند در طي زمان ياد مي گيرند كه چگونه روش ها و قانون هاي رفتاري خود را تعيين و اصلاح كنند و اين كار را با آزمون و خطا انجام مي دهند. مدل فضاي قندي نيز يك مدل جامعه مصنوعي است. به علت اينكه در مدل فضاي قندي استاندارد از يادگيري استفاده نشده , در اين تحقيق , يادگيري تقويتي در مدل فضاي قندي به كار برده شده است كه يادگيري را در انتخاب عمل هايي كه عامل ها انجام مي دهند دخالت دهد. به اين منظور يك مدل فضاي قندي يادگير با استفاده از يادگيري تقويتي پياده سازي شده و با مدل فضاي قندي بدون يادگيري مقايسه گرديد. نتايج نشان داده اند در پايان دوره زماني تعداد عامل هاي باقيمانده مدل فضاي قندي يادگير افزايش قابل توجه ي يافتند. دليل اين است كه با استفاده از شيوه يادگيري تقويتي عامل ها اعمال مفيد و مضر را به مرور زمان تشخيص داده و تلاش مي كنند كه اعمال مفيد را انجام دهند كه سبب تضمين حيات آنها مي شود.