بررسی مساله تقسیم امتیاز چند عامله در محیط های قطعی و غیر قطعی با در نظر گرفتن وظایف فصلی

سال انتشار: 1381
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,720

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI08_060

تاریخ نمایه سازی: 18 بهمن 1386

چکیده مقاله:

برای یادگیری در سیستم های چند عامله، عموما از یادگیری تقویتی استفاده می شود. در بسیاری از موارد عامل ها بهطور مستقل یاد می گیرندو تنها یک سیگنال تقویت برای کل تیم در دسترس است. در واقع درچنین شرایطی محیط هوشمندی لازم برای تعیین تاثیر عملکرد هر عامل در نتیجه تیمی را ندارد. لذا این سیگنال تقویتی باید به نحوی مناسب بین عامل ها تقسیم شود. در این پژوهش، برای حل این مساله در شرایطی که نقش هر عامل در نتیجه گروهی کسب شده نامشخص است، یک عامل به نام عامل نقاد به تیم اضافه شده است. عامل نقاد باید نقش هر عامل را در کیفیت عملکرد تیم تخمین زده و متناسب با آن بازخورد مناسب برای هرعامل راتعیین کند. دراین بررسی ایدهاستفاده از سوابق یادگیری عامل ها برای تعیین نقش هر یک در نتیجه تیمی مطرح می شود. دراین رابطه چهار معیار اطمینان، خبرگی نسبی، جمع پاداش هاو جمع پاداش و تنبیه ها بررسی شده اند. کیفیت تقسیم امتیاز بین عامل ها در دومحیط قطعی و احتمالی برای انجام وظیفه فصلی مورد بررسی و مقایسه قرار گرفته است . عامل ها با روش Q-learning به یادگیری وظیفه تک مرحله ای خود می پردازند. نتایج شبیه سازی ها تاثیر معیارهای ذکر شده را نشان میدهد.

کلیدواژه ها:

یادگیری تقویتی چند عامله ، تقسیم امتیار بین عاملها ، انتساب پاداش و تنبیه ، نقاد محلی ، وظیفه موازی عطفی

نویسندگان

اعظم جلالی

قطب علمی کنترل و پردازش هوشمند - ازمایش

مجید نیلی احمدآبادی

قطب علمی کنترل و پردازش هوشمند - ازمایش

احد هراتی

قطب علمی کنترل و پردازش هوشمند - ازمایش

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • M. Tan, ،:Multi Agent Reinforcement Learning Independent VS. Cooperative Agents" ...
  • S. Arai, _ Sycara, and T. R. Payne, *Experience Based ...
  • M. A. Abbasi, M. Nili Ahmadabadi, and M. Asadpour, _ ...
  • A. Harati, and M. Nili Ahmadabadi, _ New Approach to ...
  • & Cybernetics (SMC'2002), Hammamet, Tunisia, Oct. 2002. ...
  • G. WeiB, 0:Distributed Reinforcement Learning , Journal of Robotics and ...
  • C. Boutilier, *Planning, Learning and Coordination in Multi Agent Decision ...
  • R. S. Sutton, and A. G. Barto, _ inforcement Learning: ...
  • S. Sen, and G. Weiss, *Learning in Multiagent Systems , ...
  • K. Miyazaki, and S. Kobayashi, *Rationality of Reward Sharing in ...
  • S. Arai, K. Sycara, and T. R. Payne, *Experience Based ...
  • A. Harati, and M. Nili Ahmadabadi, *Certainty and Expertnes s-Based ...
  • نمایش کامل مراجع