A New Method for Stemming in Persian Language Considering Exceptions

سال انتشار: 1390
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 1,918

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SASTECH05_162

تاریخ نمایه سازی: 22 مرداد 1391

چکیده مقاله:

In this paper a new algorithm for stemming in Farsi language is presented. This stemmer is based on removing the suffixes and prefixes but a database is used to save the exceptions to decrease error rate. In the proposed method the speed of stemmer and also the percentage of errors are improved. The evaluation results on a small Farsi document collection show significant improvement in precision/recall

نویسندگان

Somayye Estahbanati

Azad University Science and Research Branch Ahvaz, Iran

Reza Javidan

Islamic Azad University – Beyza Branch

Mashalla Abbasi Dezfooli

Islamic Azad University Science and Research Branch Ahvaz, Iran

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • "sAsrech 201 1, Khavaran Higher-education Institute, Mashhad, Iran. May 12-14. ...
  • C. Peters et al (2008) Advances in Multilingual and Multimodal ...
  • Kashif Riaz (2007) Challenges in Urdu Stemming (A Progress Report) ...
  • Eiman Tamah Al-Shammari (2008) TOWARDS AN ERROR- FREE STEMMING J. ...
  • Kazem Taghva et al. (2005) A Stemming Algorithm for the ...
  • S. Tomlinson (2004) Lexical and algorithmic stemming compared for 9 ...
  • J. Xu and B. Croft (1998) Corpus-based stemming using cooccurrenc ...
  • نمایش کامل مراجع