تکنیکهای یادگیری ماشین برای دسته بندی متون فارسی
محل انتشار: یازدهمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1384
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,360
فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI11_138
تاریخ نمایه سازی: 5 آذر 1390
چکیده مقاله:
امروزه با گسترش روزافزون متون و نوشتار الکتریکی برای زبان فارسی وجود ابزارهای دسته بندی اتوماتیک متون اجتناب ناپذیر کرده است دراینجا با بررسی الگوریتمهای مختلف موجود برای زبانهای دیگر و در نظر گرفتن ویژگیهای ساختاری و نوشتاری زبان فارسی تهیه یک مجموعه داده مناسب استاندارد و همچنین دقت این الگوریتم ها برای زبان فارسی بحث میشود از سوی دیگر با توجه به نامشخص بودن مرز دقیق کلمات در رسم الخط فارسی موجود بدلیل ابهام، جدایی ذاتی و وندهای آزاد با پیشنهاد استفاده از توالی کلمات بجای خود کلمات در تئوری بیز دقت دسته بندی را افزایش داده است.
کلیدواژه ها:
یادگیر ماشین ، دسته بندی اتوماتیک متون ، زبان فارسی ، مجموعه داده ها برای زبان فارسی ، یادگیری با ناظر
نویسندگان
لقمان براری
دانشگاه علم و صنعت ایران
مرتضی آنالویی
دانشگاه علم و صنعت ایران
مهران گرمه
دانشگاه صنعتی شریف