یک روش پیش پردازش کارآمد و قوی برای متون فارسی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,457

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEE21_247

تاریخ نمایه سازی: 27 مرداد 1392

چکیده مقاله:

دراین مقاله به طراحی و ارایه الگوریتمی درزمینه ریشه یابی کلمات درمتون فارسی پرداخته شده است این روش که برمبنای ساختار ریخت شناسی زبان فارسی عمل می کند ازجداول جستجوو برای ریشه یابی کلمات بهره گرفته است روال کار به این صورت است که دراغاز کلمات متن جداسازی شده و کاراکتر ها و کلمات زائد آن حذف میشوند ازانجایی که تعداد افعال کاربردی زبان فارسی محدود است ابتدا با فرض اینکه کلمات فعل هستند ریشه یابی می شوند درصورتی پس ازاتمام ریشه یابی کلمه فعل تشخیص داده شود مصدر آنذخیره میشود درغیر این صورت روال ریشه یابی کلمات غیرفعل اجرا خواهد شد نتایج ازمایشات ما روی مجموعه ای ازاسناد فارسی نشان دهنده نتایج قابل قبولی برای الگوریتم ارایه شده است

کلیدواژه ها:

ریشه یابی ، زبان فارسی ، پیش پردازش زبان طبیعی

نویسندگان