تشخیص متون بر اساس مشابهت با الگوریتم یادگیری بدون ناظر خوشهبندی درسطح موردی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,059

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCCEB01_028

تاریخ نمایه سازی: 18 خرداد 1393

چکیده مقاله:

به منظور انجام برنامه آشکارسازی اسناد تکراری مشابه هم، دو روش سنتی انگشت خوانی (انگشت نگاری) و رویکرد مقایسه کلید فرمان مورد استفاده قرار میگیرند . در روش اول براساس مشابهت پایگاه داده به کار می رود و در روش دوم ، رویکرد مقایسه کلید فرمان براساس مشابهت بازیابی اطلاعات به کار برده می شود که این روش به صورت کاملاً صحیح و درست انجام نمی شود. پس میتوان ویژگی های اسناد تکراری را با اسناد تقریباً مشابه متمایز کرد. دراین مقاله، از روش ایجاد خوشه بندی در سطح نمونه برای تشخیصاسناد تکراری ومشابهت آنها استفاده نمود. چهار چوبی برای ادغام اطلاعات همچون ساختار محتوا و ویژگی های سند ها براساس فرایندهای خوشه بندی در نظر گرفته شده که برای ایجاد خوشه های تکراری و مشابه نیز مفید میباشد.

نویسندگان

محسن فرزادی

دانشگاه آزاد اسلامی واحد علوم و تحقیقات لرستان، گروه کامپیوتر،لرستان، ایران

حسن نادری

دانشگاه آزاد اسلامی واحد علوم و تحقیقات لرستان، گروه کامپیوتر،لرستان، ایران

موسی بحریه

دانشگاه شهید بهشتی،گروه کامپیوتر، تهران، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • S. Brin, J. Davis, and H. Garc ia-Molina. Copy detection ...
  • mechanisms for digital documents. In Proceedings of theSpecial Interest Group ...
  • A. Z. Broder, S. C. Glassman, M. S. Manasse, and ...
  • A. Chowdhury. O. Frieder, D. Grossman, and M. McCabe .Collection ...
  • T. Hoad and J. Zobel. Methods for identifying versioned andplagiarized ...
  • D. Klein, S. D. Kamvar, and C. D. Manning. From ...
  • D. Metzler, Y. Bernstein and W. Bruce Croft. Similarity Measures ...
  • K, Wagstaff and C, Cardie, 2000. Clustering with instance-level constraints.In ...
  • E. P. Xing, A. Y. Ng, M. I. Jordan, and ...
  • نمایش کامل مراجع