یک روش پیش پردازش کارآمد و قوی برای متون فارسی
محل انتشار: بیست و یکمین کنفرانس مهندسی برق ایران
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,457
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEE21_247
تاریخ نمایه سازی: 27 مرداد 1392
چکیده مقاله:
دراین مقاله به طراحی و ارایه الگوریتمی درزمینه ریشه یابی کلمات درمتون فارسی پرداخته شده است این روش که برمبنای ساختار ریخت شناسی زبان فارسی عمل می کند ازجداول جستجوو برای ریشه یابی کلمات بهره گرفته است روال کار به این صورت است که دراغاز کلمات متن جداسازی شده و کاراکتر ها و کلمات زائد آن حذف میشوند ازانجایی که تعداد افعال کاربردی زبان فارسی محدود است ابتدا با فرض اینکه کلمات فعل هستند ریشه یابی می شوند درصورتی پس ازاتمام ریشه یابی کلمه فعل تشخیص داده شود مصدر آنذخیره میشود درغیر این صورت روال ریشه یابی کلمات غیرفعل اجرا خواهد شد نتایج ازمایشات ما روی مجموعه ای ازاسناد فارسی نشان دهنده نتایج قابل قبولی برای الگوریتم ارایه شده است
کلیدواژه ها:
نویسندگان