دسته بندی موضوعی متون فارسی با استفاده از تکنیک های یادگیری انتقالی

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,075

فایل این مقاله در 17 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCC01_445

تاریخ نمایه سازی: 9 فروردین 1395

چکیده مقاله:

یک فرض عمده در بسیاری از الگوریتم های یادگیری ماشین یکسان بودن ابعاد ویژگی و توزیع داده ها است. اما بسیاری از کاربردهای واقعی دارای این خصوصیت نیستند. به طوری که داده هایی که الگوریتم در آینده دریافت می کند ممکن است دارای ابعاد ویژگی متفاوت و یا از توزیع دیگری باشند. در اینجا یادگیری انتقالی مطرح می شود. یادگیری انتقالی یک مسئله تحقیقاتی در حوزه یادگیری ماشین است که تمرکز آن بر روی ذخیره کردن دانش به دست آمده از حل یک مسئله و به کاربردن آن برای حل مسئله متفاوت اما مرتبط دیگری است. هدف ما در این پایان نامه استفاده از یادگیری انتقالی مبتنی بر شبکه های بیزین برای حل مسئله دسته بندی متون فارسی است. مجموعه آزمایش همشهری یکی از معتبرترین منابع در زبان فارسی در حوزه متون زبان طبیعی است. از این مجموعه، زبربیکره ای دارای 3500 متن به عنوان مجموعه ی آموزش و آزمون و همچنین به منظور استخراج کلمات کلیدی انتخاب گردید. برای ارزیابی روش پیشنهادی دو کلاس مجموعه داده یکی بدون برچسب و دیگری برچسب دار انتخاب شده و طبقه بندی نایوبیز انتقالی و نایو بیز ساده روی مجموعه داده انتخابی اعمال می شود. در این مقاله 10 جفت کلاس مختلف را تحت 10 آزمایش جداگانه مورد بررسی قرار گرفته است. نتایج سه معیار دقت، بازخوانی و معیار F حاصل از پیاده سازی، نشان دهنده دقت قابل قبول مدل پیشنهادی برای دسته بندی متون فارسی با استفاده از یادگیری انتقالی می باشد.

کلیدواژه ها:

نویسندگان

احمد امامی

دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد نیشابور

رضا قائمی

استادیار دانشگاه آزاد اسلامی واحد نیشابور ، گروه مهندسی کامپیوتر – نرم افزار

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • تشکری، مسعود، 1380، بررسی و ارزیابی روشهای شاخص گذاری خودکار ...
  • ساعتی سعید، 1384، خوشه بندی اسناد کتابخانه های دیجیتال با ...
  • آیت مریم، 1380، یک گرامر محاسباتی برای زبان فارسی، دانشگاه ...
  • سرایی و شاهقلیان، 1389، کاوش متون فارسی بر مبنای روش ...
  • Irterr ational Conference _ Inform ation Technol _ Comnunter _ ...
  • _ D. Heckerman, A tutorial on learning with Bayesian networks, ...
  • Pan, Sinno Jialin, and Qiang Yang. (2010). "A survey on ...
  • Lu, Zhongqi, et al .(2014). "Source free transfer learning for ...
  • Zhang, Wen, Xijin Tang, and Taketoshi Yoshida .(2015). "TESC: An ...
  • Bin, Z., et al .(2013). "Learning Phrase Patterns for Text ...
  • Yun, J., et al .(2012). "A multi-layer text classification framework ...
  • Lu, J., et al .(2015). "Transfer learning using computational intelligence: ...
  • Fang, M., et al .(2015). "Multi-source transfer learning based on ...
  • Dai, Wenyuan, et al.(2007). "Transferring naive bayes classifiers for text ...
  • W. Zhang, T. Yoshida, X. Tang, Text classification based _ ...
  • W. Zhang, Y. Yang, Q. Wang, Using Bayesian regression and ...
  • نمایش کامل مراجع