روشی جدید برای وزن دهی واژه ها در خوشه بندی مستندات

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 910

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

KMTTORBAT01_027

تاریخ نمایه سازی: 16 خرداد 1394

چکیده مقاله:

بازیابی اطلاعات فرایند یافتن اطلاعات مربوط به جستجوی کاربر در مجموعه مدارک مورد نظر می باشد .با پیاده سازی الگوریتم های متفاوت استراتژی های مختلفی در بازیابی اطلاعات وجود دارد وجه مشترک استراتژی های بازیابی ، یافتن مدارک مشابه با موضوع جستجوی کاربر است .یکی از الگوریتم های مهمی که در بازیابی اطلاعات ،کاربردبسیار دارد،الگوریتم های فضای برداری است که می کوشد تمام مدارک را در مجموعه وجستجوهای کاربربه صورت بردارها نشان دهد وضریب تشابه میان بردارها ی مدارک و بردار جستجو را جهت بازیابی مدارک مربوط محاسبه می کند.در این مقاله یک روش جدید برای وزن دهی واژه ها ارائه شده که بابررسی روش tf و tf idf و مشکلات آنها وآزمایشاتی که انجام شده روش مناسبی برای وزن دهی واژه ها می باشد.

نویسندگان

سمیه گراوند

دانشجوی ارشد موسسه آموزش عالی پویش

سیداحسان یثربی نایینی

عضو هیات علمی دانشگاه تربت حیدریه

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • مهردادوکلینی، بررسی مدل فضای برداری ...
  • ذ‌هابی، نگرشی جدید برای خلاصه سازی متن مبتنی بر الگوریتم ...
  • . ملکی، روش جدید وزن دهی ویزگی مبتنی براطلاعات کلاس ...
  • .مقصودی.ارائه روشی جدیددر طبقه بندی متون فارسی با اسستفاده از ...
  • .کریمی وشمس فرد، سیستم خلاصه ساز خودکار، دانشگاه شهید بهشتی، ...
  • . Anna Huang _ Similarity Measures for Text Document Clustering، ...
  • .M. Steinbach، A Comparison of Document Clustering Techniques ...
  • نمایش کامل مراجع