دسته بندی متون فارسی با استفاده از شبکه عصبی و بهره گیری از الگوریتم های LDA,PCA جهت کاهش ویژگی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 978

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCCOS02_058

تاریخ نمایه سازی: 5 مهر 1393

چکیده مقاله:

در دنیای مدرن کنونی، دستیابی به اطلاعات ارزش بالایی دارد. با افزایش حجم اطلاعات، نیاز فوقالعاده به ابزارهایی که بتوانند در جستجو، فیلترنمودن و مدیریت منابع موثر باشند، کاملاً احساس میشود. دسته بندی متون، فرآیندی است که در آن متنها در یک یا چند دسته از قبل تعریف شده براساس محتوا یا زبان نگارش متن قرار میگیرند. در این مقاله کاربرد شبکه عصبی چند لایه پرسپترون MLP در دسته بندی مستندات نیمه ساخته یافته XML بر روی پایگاه داده روزنامه همشهری بررسی شده و دستاوردهای آن مورد ارزیابی قرار گرفته است. البته برای دستهبندی مستندات با کارآیی بالا، دقت در شناسایی و انتخاب ویژگی- های مهم، نقش بسزایی دارد. به همین علت تمرکز بر روی تکنیکهای پیش پردازش مستندات و به گونه ویژه، روشهای وزندهی ویژگی مورد بررسی و تحلیل قرار گرفته و یکی از روشها TFCRF برای وزن دهی به مستنداتی که به عنوان ورودی شبکه عصبی مورد مطالعه است، بکار رفته است. در این مقاله برای استخراج بهترین ویژگیها از روش تجزیه و تحلیل مولفه های اصلی PCA با ارزیاب KNN استفاده شده و سپس نتایج آن با روش جداکننده خطی LDA ترکیب شده، در نهایت شبکه عصبی انتخاب شده مورد تست و ارزیابی قرار گرفته است. نتایج به دست آمده نشان داد که دقت دستهبندی متون فارسی با روش پیشنهادی به صورت قابل توجهی افزایش خواهد یافت

کلیدواژه ها:

شبکه عصبی چند لایه پرسپترون ، دسته بندی متون ، وزندهی ویژگی ، مستندات نیمه ساخت یافته

نویسندگان

مهدی برفامی

دانشکده کامپیوتر و فناوری اطلاعات، دانشگاه آزاد اسلامی بابل، ایران

سهیل فاطری

دانشکده کامپیوتر و فناوری اطلاعات، دانشگاه آزاد اسلامی بابل، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • مقصودی ن، همایون پور م، "ارائه روشی جدید در دسته‌بندی ...
  • Y.Yang, J. W. Wilbur, "Using CorupsStatitics Redundant Words in Text ...
  • T.M.Cover and P.E.Hart, "Nearest neighbor pattern classification, " IEEE Transaction ...
  • Y. Yang and C. G. Chute, :An example-based mapping method ...
  • symposium on document analysis and information retrieval. Las Vegas, pp. ...
  • _ Yang and X. Liu, _ Re -Examination of Text ...
  • D. D. Lewis, "Naive Bayes at forty: The independence assumption ...
  • D. _ Lewis, R. E. Schapire, J. P. Callan and ...
  • Y.Yang, J.O. Pedersen, _ Comparative Study on Feature Selection in ...
  • Information Retrieval (SIGIRO0), pp. 256-263, 2000. ...
  • J.J.Hopfield. Neurons with graded response have collective computational properties like ...
  • R. O. Duda, P. E.hart, and D. G. stork, pattern ...
  • Bishop, C. _ Pattern Recognition and Machine Learning. Springer, 2006. ...
  • S. E. Fahlman. An empirical sudy of learning speed in ...
  • J. L.McClelland and D .E.Rumelhart Parallel Distributed Processing: Exploration in ...
  • P. J. Werbos. B ackpropagation: Past and future. In Proceedings ...
  • نمایش کامل مراجع