ارائه یک الگوریتم موثر و تطبیق پذیر برای خوشه بندی متون مبتنی برPSO

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 565

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSITM02_270

تاریخ نمایه سازی: 25 بهمن 1394

چکیده مقاله:

خوشه بندی متون یکی از تکنولوژی های اصلی متنکاوی و بازیابی اطلاعات است. ایده اصلی خوشه بندی اطلاعات، جداکردن نمونه ها از یکدیگر و قراردادن آنها در گروه های شبیه به هم میباشد. عملکرد الگوریتم های خوشه بندی سنتی ممکن است به دلیل ابعاد بالا و یا حجم کم داده های متنی رضایت بخش نباشد. همچنین یکی از بزرگترین مشکلات الگوریتم های سنتی پرکاربرد مانندKmeans حساسیت بالا به نقاط اولیه است. این مقاله یک روش جدید برای خوشه بندی متون بر اساس آمارهای پیکره متنی و الگوریتم بهینه سازی ذرات ارائه میدهد. در این روش نقاط اولیه نه تنها از طریق یادگیریهای آماری ماتریس تشابه اسنادی که به یک مجموعه تقسیم شده است, بلکه از طریق اسنادی که هنوز تقسیم بندی نشدهاند نیز انتخاب می شوند. با این روش میتوان میزان حساسیت الگوریتم خوشه بندی نسبت به مجموعه نقاط اولیه را کاهش داد. برخی از مقادیر آستانهی مورد استفاده در الگوریتم از آمار خودکار و بصورت پویا بدست آمده است. این مقاله همچنین از الگوریتم بهینه سازی ذرات جهت یافتن بهترین مقادیر آستانه استفاده کرده است. نتایج تجربی بدست آمده بر روی چندین مجموعه داده نشان میدهد که الگوریتم پیشنهادی قادر به ارتقاء کیفیت خوشه بندی متون در مقایسه با الگوریتم های خوشه بندی سنتی میباشد. همچنین این الگوریتم در مجموعه داده های مختلف پایدارتر میباشد.

نویسندگان

رضا باقری

گروه کامپیوتر، واحد اراک، دانشگاه آزاد اسلامی اراک، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Xinwu Ll. Research on Text Clustering Algorithm Based _ Agglomerative ...
  • Han JW, Kamber M. Data Mining Concepts And Techniques [M], ...
  • Steinbach M, KaryPis G Kumar V. A comparison of document ...
  • Higgs R E, Bemis K G, Watson I A, Wikel ...
  • Snarey M, Terrett N K, Willet P, Wilton D J. ...
  • Pantel P, Lin D. Document clustering with committees. In Proceedings ...
  • Conference on Research and Development in Information Retrieval (SIGIR). New ...
  • G. Karypis, E. Han, and V. Kumar, "Chameleon Hierarchical clustering ...
  • S. Guha, R. Rastogi, and K. Shim, "ROCK: A robust ...
  • Guha, Sudipto; Rastogi, Rajeev; Shim, Kyuseok (2001). "CURE: An Efficient ...
  • _ Ramakrishnan, R.; Livny, M. (1996). "BIRCH: an efficient data ...
  • نمایش کامل مراجع