دسته بندی متون فارسی با Naïve Bayes

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 726

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCC02_164

تاریخ نمایه سازی: 21 شهریور 1395

چکیده مقاله:

در چند سال اخیر الگوریتم های زیادی برای مساله دسته بندی اسناد، پیشنهاد شده است. اغلب کارهای انجام شده برروی اسناد به زبان انگلیسی بوده و اخیرا در مورد زبان هایی مثل چینی و عربی کارهایی انجام شده است. در این مقالهیک دسته بندی کننده اسناد فارسی با استفاده از روش نیو بیز پیشنهاد شده است و دلیل استفاده از این الگوریتم موفقیت زیاد آن در دسته بندی اسناد مشابه در زبان انگلیسی بوده است این دسته بند بوسیله متون فارسی پیکره همشهری 2 موردآزمایش قرار داده شد. در این آزمایش 6 دسته مختلف از پیکره انتخاب شده بود که در این میان، برای دسته هایهنری، مذهبی، ورزشی و علمی دقت و بازخوانی یک بدست آمد که بهترین عملکرد ممکن می باشد و برای دستهپزشکی دقت 0.917 و بازخوانی یک و برای دسته رایانه بازخوانی 0.9 و دقت 1 بدست آمد.

نویسندگان

شهریار زارع زاد

گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

احمد حبیبی زادنوین

گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

نیما جعفری زادنوین

گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Agarwal, B., Mittal, N. (2014). Text classification using machine learning ...
  • Aggarwal, C.C. (2012). Mining Text Data, Springer, (Ch. A Survey ...
  • Al-Shalabi, R., Kanaan, Gh. (2006). "Arabic Text Categorization Using KNN ...
  • Altyncay, h., Erenel, z. (2010). Analytical evaluation of term weighting ...
  • Amiri, H., AleAhmad, A. and et. al.(2008). "Keyword Suggestion Using ...
  • Baeza-Yates, R., Ribeiro-Neto, B. (1999). Chapter 3 Retrieval evaluation. In ...
  • Basiri, M., Neimati, Sh., ghasem aghayi, N. (2007). _ Compare ...
  • Dahmouyad, A. (2007). "automatic classification of ...
  • Csurka, G., Dance, C.R., Fan, L., Willamowski, J., Bra, C., ...
  • Debole, f., Sebastiani, f.(2003). Supervised term weighting for automated text ...
  • Djuric, n., Lan, I., Vucetic, s., Wang, z. (2013). Budgetedsvm: ...
  • Computing, SAC 03, ACM, New York, NY, USA, 2003, pp. ...
  • «1 Intcrmationl Confcrcncc & 3"" National Confcrcncc on Ncw Tcchnologics ...
  • Elahimanesh, M.H., Minaei, B., and Malekinezhad, H. (2012). Improving K-nearest ...
  • Forman, G. (2003), An extensive empirical study of feature selection ...
  • classification of Persian documents by means of Naive Bayes and ...
  • Kanaan, gh., Al-Shalabi, r., Al-Akhras, a. (2006). "KNN Arabic Text ...
  • Khreisat, L.(2004). Arabic Text Classification using N-gram frequency statistics, tech. ...
  • Khreisat, L., (2009). _ A Machine learning approach for Arabic ...
  • Su, J., Lu, Y. (2009). Supervised and traditional term ...
  • weighting methods for automatic text categorization, Trans. PAMI 31 (4) ...
  • Maghsoodi, N., H omayoumpou. M.M., (2011). Improving Farsi multiclass text ...
  • identification system using robust features, Int. J. Speech Technol. 17 ...
  • Rama sundaram, S., Victor, S.P. (2010). "Text Categorization by B ...
  • Salton, G., Yang, C.S., (1973). On the specification of term ...
  • Manchala, S., Prasad, V.K., Janaki, V., (2014). ...
  • «1 Intcrmationl Confcrcncc & 3"" National Confcrcncc on Ncw Tcchnologics ...
  • Salton, G., Buckley, C. (1988), T erm-weighting approaches in automatic ...
  • Sebastiani, F.(2002). "machine learning in automated tex _ ategorization" _ ...
  • Sebastiani, F., (2008). Machine learning in automated tex categorization, ACM ...
  • Sivic, J., Zisserman, A. (2003). Video Google: _ text retrieval ...
  • Tam, V., Santoso, A., Setiono, R. (2002). _ comparative study ...
  • Turney, P., Pantel, P. (2010). From frequency to meaning: vector ...
  • Wang, P., Domeniconi, C., (2008). Building semantic kernels for text ...
  • Wang, Z., Sun, X., Zhang, D., Li, X.(2006)."An Optimal SVM-Based ...
  • Wanga, J. Liub, P., Shea, M.F., Nahavandia, S., Kouzanid, A. ...
  • Yang, Y., Pedersen, J.O. (1997). A comparative study on feature ...
  • Yari, A.. abbasi, A. and Moemen Bellah, S. (2010). Presenting ...
  • categorization, " In Proceeding of the _ Recognition, pp. 235-238. ...
  • نمایش کامل مراجع