اتوماتاهای یادگیر، راه حلی برای بازی های غیر قطعی بامجموع کلی

بهروز معصومی; محمدرضا میبدی; برنا جعفرپور

اتوماتاهای یادگیر، راه حلی برای بازی های غیر قطعی بامجموع کلی

محل انتشار: دومین کنگره مشترک سیستمهای فازی و هوشمند ایران

سال انتشار: 1387

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 833

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/204011

شناسه ملی سند علمی:

FJCFIS02_302

تاریخ نمایه سازی: 26 تیر 1392

چکیده مقاله:

بازی های غیر قطعی(اتفاقی) برای مدل سازی سیستمهای چند عامله بسیار مورد استفاده قرار گرفته اند.این بازیها توسعه ای از فرآیندهای تصادفی مارکوف با چندین عامل و بازی های ماتریسی با چندین حالت هستند.هدف هرعامل پیدا کردن سیاستبهینه ای است بطوریکه امید ریاضی مجموع کاهشیافته پاداشها را بیشینه نماید. در این مقاله یک مدل یادگیری تقویتی مبتنی بر اتوماتاهای یادگیر برای حل بازی های اتفاقی با مجموع کلی برای یافتن خطمشی بهینه پیشنهاد شده است.بازای هر حالت در محیط یک اتوماتا قرار داده شده بطوریکه تعداد اعمال هر اتوماتا با توجه به همسایگانش تعیین میگردد.هر اتوماتا مسوول انتخاب حالتبعدی محیط است. آزمایشهای انجام گرفته نشان دادهاند که الگوریتم ارائه شده از کارایی مناسبی از هر دو جنبه هزینه و سرعت رسیدن به راهحل بهینه برخوردار است

کلیدواژه ها:

سیستمهای چند عامله ، اتوماتاهای یادگیر ، یادگیری تقویتی چند عامله ، بازی های اتفاقی

نویسندگان

بهروز معصومی

دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران و مرکز تحقیقات

محمدرضا میبدی

دانشگاه صنعتی امیرکبیر تهران

برنا جعفرپور

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

For Episod =1 to M do ...
While not done 3. _ initial Value ...
for each agent k do cuncurrently ...
_ _ _ Autonomous Agents _ Multi-Agent Systems", v.3 n.4, ...
P. Stone, M. Veloso, "Multiagent systems: ...
dec entralized control of processes, Mathematics Research, Vol. 27, No. ...
Artificial Intelligence, 1999. ...
M. L. Littman, "Markov games as a framework for multi-agent ...
J. Hu and M P. Wellman, _ Learning about Other ...
J. Hu and M. P. _ _ Learning for General-Sum, ...
H. Qio , F. Szidarovszky , Rozenblit and L. Yong, ...
M. Song, J. Bai, R. Chen , " A New ...
Learning automata: Prentice Hall, 1989. ...
iversity of Technology, 2007. ...

نمایش کامل مراجع