بکارگیری NN-Qlearning به منظور هماهنگی و همکاری بین عامل های بازیکن در تیم شبیه سازی فوتبال روباتها

سال انتشار: 1382
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,085

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICIKT01_031

تاریخ نمایه سازی: 24 اردیبهشت 1388

چکیده مقاله:

یادگیری تقویتی، از روشهای یادگیری در عامل های هوشمند است که در محیط هایی فعالیت می کنند که حالات آغازین و جواب مشخص، ولیکن نحوه نیل به هدف برای عامل در آغاز کار مشخص نمی باشد. در یادگیری تقویتی نیاز است که عامل محیط را شناخته و توابع انتقال بین حالات محیط را داشته باشد. برای فعالیت عامل در محیط های ناشناخته می توان از روش QLearning استفاده کرد؛ که در آن با توجه به نتایج حاصله از عملیات قبلی، عملیات مناسب بعدی مشخص می گردد. این روش نیاز به ذخیره لیست Q داشته که با بزرگ شدن این جدول امکان بکارگیری آن در محیط های بلادرنگ بعلت افزایش زمان جستجو و نیاز به حافظه زیاد امکان پذیر نیست. در این مقاله برای حل این مشکل روش NN-QLearning معرفی گردیده و با توجه به اینکه روبات فوتبالیست و مسابقه فوتبال روباتها بستر مناسبی جهت تست تحقیقات هوش مصنوعی و روباتیک ارائه می دهد، از آن برای تعیین کارایی روش معرفی شده استفاده گردیده است.

کلیدواژه ها:

عامل های هوشمند- یادگیری تقویتی - یادگیری کیو- NN-Qlearning- فوتبال روباتها

نویسندگان

نصرا... مقدم

دانشگاه تربیت مدرس، بخش برق، گروه کامپیوتر

سهیل کارشناس

مرکز تحقیقات مخابرات ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Baird, K.Residual Algorithms: _ Reinforcemnt learning with function approx imiation. ...
  • caraeris, m.batlle , j.and radio, p.hybrid "Coordination of Rinforcement Learning-B ...
  • Hernandez _ n.mahadevan , "Hierarchical Memory - Based Rein forcement ...
  • Sutton , r. barto, a . _ Reinforc ement Learning: ...
  • leslie pack kaelbling and Michael l.littman. _ R einforcement Learning ...
  • noda itsuki. "Soccer Server Manual" rev.l.03 (for SOccer server ver.2.76 ...
  • jyh-shing jang _ etal ."Neuro-fuzzy and Soft Computing : A ...
  • gerhand weiss . "Multiagent Systems: A Modern Approach to Distributed ...
  • peter stone, Manuela veloso, Patrick riley ;the cmunited-99 simulator team; ...
  • jinyi yaol, jiang chen2 and zengqi sunl; "An Application in ...
  • h.matsubrar , i.noda and k. firaki, "Learning of Cooperative Action ...
  • marce carreras , pere ridao , Rafael Garcia and ZOran ...
  • نمایش کامل مراجع