معادل یابی اعمال در عاملهای غیر همسان: گامی به سوی همکاری در یادگیری

سیدمحمدرضا میرفتاح; مجید نیلی احمدآبادی; بابک نجاراعرابی

معادل یابی اعمال در عاملهای غیر همسان: گامی به سوی همکاری در یادگیری

محل انتشار: هشتمین کنفرانس سالانه انجمن کامپیوتر ایران

سال انتشار: 1381

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,653

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/46725

شناسه ملی سند علمی:

ACCSI08_043

تاریخ نمایه سازی: 18 بهمن 1386

چکیده مقاله:

همکاری در یادگیری، سرعت و کیفیت یادگیری را ارتقاء می دهد. آنچه که باید مورد توجه ویژه قرار گیرد، نحوه همکاری عاملهای غیر همسان است. اگر مساله غیر همسانی به نحو مطلوبی حل و فصل نشود، همکاری در یادگیری نه تنها مفید نیست، بلکه می تواند یادگیری انفرادی عاملها را مختل کند. در این مقاله با استفاده ازجدول نگاشت اعمال، نوعی از همکاری برای حل مساله غیر همسانی موجود در مجموعه اعمال عاملها پیشنهاد شدهاست. در این روش، برای هر عمل از یک عامل، معادلهای ممکن درمجموعه اعمال عامل دیگر پیدا میشود. با استفاده از روش پیشنهادی می توان ضمن پیشرفت روند یادگیری فردی (با روش Q-Learning) معادل یابی اعمال را نیز انجام داد. به این منظور از قالبی مشابه Q-Learning برای یادگیری جدول نگاشت اعمال استفاده شدهاست. این روش در دوحالت مورد بررسی قرار گرفته است، در حالتی که مجموعه اعمال عاملهایکسان اما ترتیب انها ناشناخته است و در حالتی که مجموعه اعمال یکی از زیر مجموعۀ مجموعه اعمال دیگری است. کمک گرفتن از عاملی خبره تر برای انتخاب اعمال، یک فرضیه اساسی تامین کننده صحت این روش است. در هر دو حالت نشان داده شده که خبره تر بودن عامل پیشنهاد دهنده اعمال، به سریع تر پیدا شدن معادلها کمک می کند. هرچه این خبرگی کمتر باشد، مدت زمان همگرا شدن جدول نگاشت اعمال طولانی تر شده و احتمال همگرا شد به مقادیر نادرست بیشتر می شود. صحت عملکرد روش پیشنهادی با کمک ازمایش هایی نشان داده شده است.

کلیدواژه ها:

عاملهای غیرهمسان ، جدول نگاشت اعمال ، همکاری در یادگیری ، یادگیری تقویتی

نویسندگان

سیدمحمدرضا میرفتاح

قطب علمی کنترل و پردازش هوشمند و آزمایش

مجید نیلی احمدآبادی

قطب علمی کنترل و پردازش هوشمند و آزمایش

بابک نجاراعرابی

قطب علمی کنترل و پردازش هوشمند و آزمایش

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Majid Nili Ahmadabadi and Masoud Asadpour, *Expertness Based Cooperative Q-learning ...
Richard S. Sutton and Andrew G. Barto, "Reinfo rcement Learning: ...
M. Tan, "Multi-agent reinforcement learning: Independent _ COoperative agents , ...
S.M.Reza Mirfattah and Majid Nili Ahmadabadi, "Cooperative Q-learning with heterogeneity ...
B. Silver, W. Frawley, G. Iba and J. Vittal, 4ILS: ...
Susan E. Lander, « Distributed Search and Conflict Munagement _ ...
S.E. Lander and V.R. Lesser, _ Unde rstanding the role ...
Winton H. E. Davies, ، ANIMALS: A Distributed, Heterogen eous ...
_ Kawaishi and S. Yamada, ، 'Experimental Comparison of _ ...
Bob Price and Craig Boutilier, 4Imitation and Reinfo rcement Learning ...

نمایش کامل مراجع