خوشه بندی اسناد با استفاده از روش کار مبتنی بر افزار داده ها

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 517

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCSC01_071

تاریخ نمایه سازی: 8 آبان 1395

چکیده مقاله:

بازیابی متون به فن آوری جستجو و استخراج اطلاعات از مجموعه اسناد متنی گفته می شود. طبقه بندی داده های متنی به عنوان یکی از روشها در این راستا می باشد که همراه با چالشهای از قبیل پیچیدگی داده ها، بزرگی چه از نظر تعداد چه از نظر ابعاد و همچنین وجود ساختار سلسله مراتبی برای اکثر داده ای متنی می باشد. برای غلبه بر این مشکلات نیاز به روشهایی است که ضمن برطرف نمودن مشکلات مذکور دقت طبقه بندی را نیز افزایش دهد. در این تحقیق ضمن پیش پردازش داده های متنی و تبدیل آن به ماتریسهای عددی از یک روش دو مرحله ای مبتنی بر افزار بندی برای غلبه بر مشکلات مذکور در داده های متنی استفده شده است نتایج بدست آمده از اجرای این روش بر روی مجموعه داده متنی در مقایسه با روشهای افرازبندی و سلسله مراتبی اجرا شده و بر روی داده های متنی حای از آن است که دقت طبقه بندی متون نسبت به الگوریتمهای مورد مقایسه افزایش یافته است.

کلیدواژه ها:

الگوریتم k-means خوشه بندی ، روش تقسیم و غلبه ، روش افزار بندی ، مدل فضای برداری

نویسندگان

سیده نوشین اخوندی

کارشناسی ارشد دانشکده فنی مهندسی دانشگاه آزاد اسلامی علوم و تحقیقات تهران البرز

مجید خلیلیان

استادیار دانشکده فنی و مهندسی دانشگاه آزاد اسلامی کرج

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Leena. H. Patil, Mohammed Atique. 2013. A novel Approach For ...
  • Wang Z, Liu Z, Chen D, Tang K. 2011. A ...
  • Steinbach M, Karypis G, Kumar V. 2002. A comparison of ...
  • Luo C, Li Y, Chung S.M. 2009. Text document clustering ...
  • Kamel N, Ouchen I, Baali K. 2014. A Sampling-P SO-K-means ...
  • Agrawal R, Phatak M. 2012. A Novel Algorithm for Automatic ...
  • Kumar R, Ranjan A, Dhar J. 2012. A Fast and ...
  • Jadon Ch, Khunteta A. 2013. A New Approch of TDocument ...
  • Khalilian M, Mustapha N, Nasir S, Mamat A. 2010.A novel ...
  • Kononenko I, Kumar M. 2007. Machine Learning and Data Mining ...
  • نمایش کامل مراجع