درک یک عامل از خبرگی خود به عنوان ابزاری برای ارزیابی خبرگی دیگر عاملها

سال انتشار: 1383
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,025

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI10_227

تاریخ نمایه سازی: 25 آذر 1390

چکیده مقاله:

هنگامی که در سیستمهای چند عامله از روشهای یادگیری تقویتی استفاده می شود همکاری در یادگیری موضوعیت می یابد زیرا استفاده از دانش و تجربه ی دیگران باعث میشود که یک عامل نیاز کمتری به تجربه شخصی داشته باشد و حتی در مورد موقعیت هایی که آنها را تجربه نکرده دارای دانش گردد البته بهره گیری از دانش دیگران زمانی مطمئن و منطقی است که آنها خبره تر باشند دراین مقاله براساس یک ایده حسی - ذهنی ابتدا برای درک یک عامل از خبرگی خود الگوریتمهایی ارایه می شود که در آنها عامل جداولی را برای ثبت نشانه های خبرگی ایجاد کرده ودرحین یادگیری تغییرشان میدهد سپس با فرض آنکه عامل یادگیر خبرگی خود را میداند ما دیگر عاملها چنین شناختی از خود ندارند براساس مفاهیم وروشهای شناسایی الگو راهی پیشنهادمی شود کهعامل یادگیر بتواند مبتنی بر خبرگی خود و با استفاده از جدول Q سایر عاملها تخمینی از محدوده خبرگی دیگران به دست آورد تا به شکل کارآمدی از دانش عاملهای خبره تر از خود استفاده کند.

نویسندگان

احمد ایمانی پور

آزمایشگاه هوش مصنوعی و رباتیک قطب علمی کنترل و پردازش هوشمند گروه مه

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • سحرمسطورعشق، مجید نیلی احمدآبادی، بابک نجار اعرابی، " همکاری در ...
  • سحرمسطورعشق، "همکاری در بادگیری در عامل‌ها با نواحی خبرگی متفاوتء، ...
  • Watkins, C. , "Learning with Delayed _ Ph.D. Dissertation, Cambridge ...
  • R.S. Sutton and A.CG.Barto, "Reinforcement !earning: An introduction.", Cambridge. MA: ...
  • M. Nili AlradAbadi and M. Asadpur, "Cooperative Q-learming d Knowledge ...
  • M. Tan, "Multi-agent Reintorcement Learning: Independent vs. Cooperative Agents , ...
  • S. Mastour Eshgh and M. Nili AhmadAbadi, " An Extension ...
  • S. Mastour Eshgh, B. Araabi and M. Nili , AhmadAbadi, ...
  • نمایش کامل مراجع