یک ریشه یاب فارسی مبتنی بر قاعده با استفاده از عبارات منظم

سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,491

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICS11_109

تاریخ نمایه سازی: 14 مهر 1392

چکیده مقاله:

استخراج خودکار ریشه کلمات یکی از مسائل اساسی و پر اهمیت در پردازش زبان های طبیعی و بازیابی اطلاعات متنی است. در این مقاله انواع رهیافت های رایج در طراحی ریشه یاب ها مورد بررسی قرار گرفته اند. سپس با بررسی قواعد صرفی کلمات در ساخت واژه زبان فارسی به طراحی یک ریشه یاب خودکار پرداخته شده است. ریشه یاب پیشنهادی بر پایه مجموعه ای از قواعد که به صورت عبارات منظم بیان شده اند؛ اقدام به حذف پیشوند و پسوند کلمات می کند. در این مقاله، استثنائات و مسائل موجود در صرف کلمات فارسی بررسی شده و راهی برای حل آنها ارائه شده است. سپس ریشه یاب پیشنهادی مورد آزمایش و مقایسه قرار گرفته، که نتایج آن نشان دهنده ی دقت بسیار بیشتری در مقایسه با ریشه یاب های پیشین است. با توجه به کارهای انجام شده در این زمینه، ریشه یاب پیشنهادی، برای اولین بار به بررسی و حل برخی از مشکلات ریشه یابی در زبان فارسی پرداخته است

کلیدواژه ها:

نویسندگان

حسین تقی زاده

دانشکده مهندسی برق و کامپیوتر دانشگاه شیراز

محمدهادی صدرالدینی

دانشکده مهندسی برق و کامپیوتر دانشگاه شیراز

محمدحسن دیانتی

دانشکده مهندسی برق و کامپیوتر دانشگاه شیراز

امیرحسین راسخ

دانشکده مهندسی برق و کامپیوتر دانشگاه شیراز

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • W. B. Frakes and . Baeza-Yates, Information Retrieval: Data Structures ...
  • C. Bento, A. Cardoso, and G. Dias, Eds., "EPIA 05: ...
  • M. F. Porter, "An algorithm for suffix stripping, " Program, ...
  • J. Mayfield and P. McNamee, "Single n-gram stemming, " Procedings ...
  • M. Melucci and N. Orio, :A novel method for stemmer ...
  • M. Tashakori, M Meybodi, and F Oroumchian, "Bon : First ...
  • K. Taghva, R. Beckley, and M. Sadeh, _ stemming algorithm ...
  • A. H. Jadidinejad, F. Mahmoudi, and J. Dehdar, "Evaluation of ...
  • L. Dolamic and , Savoy, "Persian Language, Is Stemming Efficient?, ...
  • O. Kashefi, M. Nasri, K. Kanani, M. Senobari, and S. ...
  • R. Krovetz, "Viewing morphology as an inference process, " in ...
  • W. B. Frakes, "Stemming algorithms, " in Information Retrieval Dato ...
  • M. Ghayoomi, "Bootstrapping the Development of an HPSG based Treebank ...
  • J. B. Lovins, "Development of a stemming algorithm, " Mechanical ...
  • نمایش کامل مراجع