دسته بندی متون فارسی با Naïve Bayes
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 726
فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ITCC02_164
تاریخ نمایه سازی: 21 شهریور 1395
چکیده مقاله:
در چند سال اخیر الگوریتم های زیادی برای مساله دسته بندی اسناد، پیشنهاد شده است. اغلب کارهای انجام شده برروی اسناد به زبان انگلیسی بوده و اخیرا در مورد زبان هایی مثل چینی و عربی کارهایی انجام شده است. در این مقالهیک دسته بندی کننده اسناد فارسی با استفاده از روش نیو بیز پیشنهاد شده است و دلیل استفاده از این الگوریتم موفقیت زیاد آن در دسته بندی اسناد مشابه در زبان انگلیسی بوده است این دسته بند بوسیله متون فارسی پیکره همشهری 2 موردآزمایش قرار داده شد. در این آزمایش 6 دسته مختلف از پیکره انتخاب شده بود که در این میان، برای دسته هایهنری، مذهبی، ورزشی و علمی دقت و بازخوانی یک بدست آمد که بهترین عملکرد ممکن می باشد و برای دستهپزشکی دقت 0.917 و بازخوانی یک و برای دسته رایانه بازخوانی 0.9 و دقت 1 بدست آمد.
کلیدواژه ها:
نویسندگان
شهریار زارع زاد
گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران
احمد حبیبی زادنوین
گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران
نیما جعفری زادنوین
گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :