و EFIM+ یک الگوریتم کارا برای کشف مجموعه اقلام باارزش با محدودیت طول

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 464

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICIKT09_017

تاریخ نمایه سازی: 21 اردیبهشت 1397

چکیده مقاله:

استخراج مجموعه اقلام با ارزش که یکی از زیر مسایل استخراج مجموعه اقلام پرتکرار است، نقش مهمی در حوزه داده کاوی داشته و در کاربردهای فراوانی مورد استفاده قرار میگیرد. مجموعه اقلام با ارزش، مجموعه ای از اقلام است که در پایگاه داده تراکنشی منجر به ارزش و سود بالاتری شده و در نتیجه اهمیت بیشتری دارند. الگوریتم های موجود برای استخراج مجموعه اقلام با ارزش، معمولا به سمت استخراج مجموعه هایی با تعداد اقلام زیاد می روند زیرا مجموع ارزش این اقلام باعث افزایش ارزش کل مجموعه می شود. این در حالی است که مجموعه هایی با تعداد اقلام زیاد معمولا از لحاظ کاربردی کمتر مورد توجه بوده و تعداد آنها نیز کم است. بنابراین نیاز به تعریف مسیله جدیدی است که هدف آن پیدا کردن مجموعه اقلام با ارزشی است که دارای تعداد اقلامی کمتر از یک حد آستانه از پیش تعریف شده باشد. در این مقاله الگوریتمی پیشنهاد شده است که با ایجاد تغییرات لازم بر روی الگوریتم EFIM (سریعترین الگوریتم استخراج مجموعه اقلام با ارزش حال حاضر) محدودیت طول را نیز لحاظ می کند. روش پیشنهادی با بازتعریف پارامترهای لازم برای کاهش فضای جستجو، تنها مجموعه اقلام با ارزشی را پیدا میکند که تعداد اقلام آنها کمتر از حد آستانه باشد. نتایج ارزیابی برروی پایگاه داده استاندارد نشان می دهد روش پیشنهادی در مقایسه با الگوریتم مشابه، علاوه بر اینکه دارای زمان اجرای بهتری است، حافظه کمتری نیز اشغال میکند.

کلیدواژه ها:

داده کاوی ، مجموعه اقلام با ارزش ، استخراج مجموعه اقلام با ارزش با محدودیت طول ، پایگاه داده تراکنش

نویسندگان

محمود سلطانی

دانشگاه مهندسی فناوری های نوین قوچان، گروه مهندسی کامپیوتر

ازاده سلطانی

دانشگاه بجنورد، گروه مهندسی کامپیوتر