دسته بندی متون فارسی با Naïve Bayes

شهریار زارع زاد; احمد حبیبی زادنوین; نیما جعفری زادنوین

دسته بندی متون فارسی با Naïve Bayes

محل انتشار: دومین کنفرانس بین المللی و سومین همایش ملی کاربرد فناوری های نوین در علوم مهندسی

سال انتشار: 1394

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 726

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/501792

شناسه ملی سند علمی:

ITCC02_164

تاریخ نمایه سازی: 21 شهریور 1395

چکیده مقاله:

در چند سال اخیر الگوریتم های زیادی برای مساله دسته بندی اسناد، پیشنهاد شده است. اغلب کارهای انجام شده برروی اسناد به زبان انگلیسی بوده و اخیرا در مورد زبان هایی مثل چینی و عربی کارهایی انجام شده است. در این مقالهیک دسته بندی کننده اسناد فارسی با استفاده از روش نیو بیز پیشنهاد شده است و دلیل استفاده از این الگوریتم موفقیت زیاد آن در دسته بندی اسناد مشابه در زبان انگلیسی بوده است این دسته بند بوسیله متون فارسی پیکره همشهری 2 موردآزمایش قرار داده شد. در این آزمایش 6 دسته مختلف از پیکره انتخاب شده بود که در این میان، برای دسته هایهنری، مذهبی، ورزشی و علمی دقت و بازخوانی یک بدست آمد که بهترین عملکرد ممکن می باشد و برای دستهپزشکی دقت 0.917 و بازخوانی یک و برای دسته رایانه بازخوانی 0.9 و دقت 1 بدست آمد.

کلیدواژه ها:

دسته بندی ، متون فارسی ، نیوبیز

نویسندگان

شهریار زارع زاد

گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

احمد حبیبی زادنوین

گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

نیما جعفری زادنوین

گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Agarwal, B., Mittal, N. (2014). Text classification using machine learning ...
Aggarwal, C.C. (2012). Mining Text Data, Springer, (Ch. A Survey ...
Al-Shalabi, R., Kanaan, Gh. (2006). "Arabic Text Categorization Using KNN ...
Altyncay, h., Erenel, z. (2010). Analytical evaluation of term weighting ...
Amiri, H., AleAhmad, A. and et. al.(2008). "Keyword Suggestion Using ...
Baeza-Yates, R., Ribeiro-Neto, B. (1999). Chapter 3 Retrieval evaluation. In ...
Basiri, M., Neimati, Sh., ghasem aghayi, N. (2007). _ Compare ...
Dahmouyad, A. (2007). "automatic classification of ...
Csurka, G., Dance, C.R., Fan, L., Willamowski, J., Bra, C., ...
Debole, f., Sebastiani, f.(2003). Supervised term weighting for automated text ...
Djuric, n., Lan, I., Vucetic, s., Wang, z. (2013). Budgetedsvm: ...
Computing, SAC 03, ACM, New York, NY, USA, 2003, pp. ...
«1 Intcrmationl Confcrcncc & 3"" National Confcrcncc on Ncw Tcchnologics ...
Elahimanesh, M.H., Minaei, B., and Malekinezhad, H. (2012). Improving K-nearest ...
Forman, G. (2003), An extensive empirical study of feature selection ...
classification of Persian documents by means of Naive Bayes and ...
Kanaan, gh., Al-Shalabi, r., Al-Akhras, a. (2006). "KNN Arabic Text ...
Khreisat, L.(2004). Arabic Text Classification using N-gram frequency statistics, tech. ...
Khreisat, L., (2009). _ A Machine learning approach for Arabic ...
Su, J., Lu, Y. (2009). Supervised and traditional term ...
weighting methods for automatic text categorization, Trans. PAMI 31 (4) ...
Maghsoodi, N., H omayoumpou. M.M., (2011). Improving Farsi multiclass text ...
identification system using robust features, Int. J. Speech Technol. 17 ...
Rama sundaram, S., Victor, S.P. (2010). "Text Categorization by B ...
Salton, G., Yang, C.S., (1973). On the specification of term ...
Manchala, S., Prasad, V.K., Janaki, V., (2014). ...
«1 Intcrmationl Confcrcncc & 3"" National Confcrcncc on Ncw Tcchnologics ...
Salton, G., Buckley, C. (1988), T erm-weighting approaches in automatic ...
Sebastiani, F.(2002). "machine learning in automated tex _ ategorization" _ ...
Sebastiani, F., (2008). Machine learning in automated tex categorization, ACM ...
Sivic, J., Zisserman, A. (2003). Video Google: _ text retrieval ...
Tam, V., Santoso, A., Setiono, R. (2002). _ comparative study ...
Turney, P., Pantel, P. (2010). From frequency to meaning: vector ...
Wang, P., Domeniconi, C., (2008). Building semantic kernels for text ...
Wang, Z., Sun, X., Zhang, D., Li, X.(2006)."An Optimal SVM-Based ...
Wanga, J. Liub, P., Shea, M.F., Nahavandia, S., Kouzanid, A. ...
Yang, Y., Pedersen, J.O. (1997). A comparative study on feature ...
Yari, A.. abbasi, A. and Moemen Bellah, S. (2010). Presenting ...
categorization, " In Proceeding of the _ Recognition, pp. 235-238. ...

نمایش کامل مراجع