بهبود کارایی در سیستمهای چند عامله مبتنی بر اتوماتای یادگیربا استفاده ازمفهوم آنتروپی

سال انتشار: 1389
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,641

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IDMC04_047

تاریخ نمایه سازی: 15 دی 1389

چکیده مقاله:

تابحال برای مدلسازی سیستم های چند عامله مدلهای مختلفی مبتنی بر مدل مارکوف پیشنهاد شدها ست که از جمله آنها مدل بازیهای مارکوفی را می توان نام برد دراین مقاله روشی جدیدبا استفاده از مفهوم انتروپی در سیستمهای چند عامله مبتنی بر اتوماتاهای یادگیر با هدف بهبود کارایی ارائه شدها ست. سیستم چند عامله مورد نظر برای پیدا کردن خط مشی بهینه بازی های مارکوف مورد استفاده قرار میگیرد. درالگوریتم پیشنهادی در هر حالت از محیط به ازای هر عامل بازی یک اتوماتای یادگیرقرار داده می شود تا بتوانند عاملهای محیط را کنترل نمایند تعداد اعمال هر اتوماتای یادگیر با توجه به حالتهای مجاور با آن تعیین می گردد و ترکیب اعمال اتوماتای یادگیر هر حالت از محیط حالت بعدی را تعیین میکند درالگوریت مطرح شده اعمال انتخابی اتوماتاهای درون مسیر با توجه به هزینه مسیر طی شده و انتروپی به دست آمده از بردارهای احتمالات اعمال اتوماتای یادگیر هر حالت پاداش یا جریمه می گیرند.

نویسندگان

بهروز معصومی

دانشکده مهندسی کامپیوتر وفناوری اطلاعات دانشگاه آزاد قزوین

محمدرضا میبدی

دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه صنعتی امیرکبیر تهر