تکنیکهای یادگیری ماشین برای دسته بندی متون فارسی

سال انتشار: 1384
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,360

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI11_138

تاریخ نمایه سازی: 5 آذر 1390

چکیده مقاله:

امروزه با گسترش روزافزون متون و نوشتار الکتریکی برای زبان فارسی وجود ابزارهای دسته بندی اتوماتیک متون اجتناب ناپذیر کرده است دراینجا با بررسی الگوریتمهای مختلف موجود برای زبانهای دیگر و در نظر گرفتن ویژگیهای ساختاری و نوشتاری زبان فارسی تهیه یک مجموعه داده مناسب استاندارد و همچنین دقت این الگوریتم ها برای زبان فارسی بحث میشود از سوی دیگر با توجه به نامشخص بودن مرز دقیق کلمات در رسم الخط فارسی موجود بدلیل ابهام، جدایی ذاتی و وندهای آزاد با پیشنهاد استفاده از توالی کلمات بجای خود کلمات در تئوری بیز دقت دسته بندی را افزایش داده است.

کلیدواژه ها:

یادگیر ماشین ، دسته بندی اتوماتیک متون ، زبان فارسی ، مجموعه داده ها برای زبان فارسی ، یادگیری با ناظر

نویسندگان

لقمان براری

دانشگاه علم و صنعت ایران

مرتضی آنالویی

دانشگاه علم و صنعت ایران

مهران گرمه

دانشگاه صنعتی شریف