یک ریشه یاب فارسی مبتنی بر قاعده با استفاده از عبارات منظم

حسین تقی زاده; محمدهادی صدرالدینی; محمدحسن دیانتی; امیرحسین راسخ

یک ریشه یاب فارسی مبتنی بر قاعده با استفاده از عبارات منظم

محل انتشار: یازدهمین کنفرانس سراسری سیستم های هوشمند

سال انتشار: 1391

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 2,491

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > پردازش زبان طبیعی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/214691

شناسه ملی سند علمی:

ICS11_109

تاریخ نمایه سازی: 14 مهر 1392

چکیده مقاله:

استخراج خودکار ریشه کلمات یکی از مسائل اساسی و پر اهمیت در پردازش زبان های طبیعی و بازیابی اطلاعات متنی است. در این مقاله انواع رهیافت های رایج در طراحی ریشه یاب ها مورد بررسی قرار گرفته اند. سپس با بررسی قواعد صرفی کلمات در ساخت واژه زبان فارسی به طراحی یک ریشه یاب خودکار پرداخته شده است. ریشه یاب پیشنهادی بر پایه مجموعه ای از قواعد که به صورت عبارات منظم بیان شده اند؛ اقدام به حذف پیشوند و پسوند کلمات می کند. در این مقاله، استثنائات و مسائل موجود در صرف کلمات فارسی بررسی شده و راهی برای حل آنها ارائه شده است. سپس ریشه یاب پیشنهادی مورد آزمایش و مقایسه قرار گرفته، که نتایج آن نشان دهنده ی دقت بسیار بیشتری در مقایسه با ریشه یاب های پیشین است. با توجه به کارهای انجام شده در این زمینه، ریشه یاب پیشنهادی، برای اولین بار به بررسی و حل برخی از مشکلات ریشه یابی در زبان فارسی پرداخته است

کلیدواژه ها:

بازیابی اطلاعات متنی ، پردازش زبان طبیعی ، ریشه یابی ، ساخت واژه زبان فارسی

نویسندگان

حسین تقی زاده

دانشکده مهندسی برق و کامپیوتر دانشگاه شیراز

محمدهادی صدرالدینی

دانشکده مهندسی برق و کامپیوتر دانشگاه شیراز

محمدحسن دیانتی

دانشکده مهندسی برق و کامپیوتر دانشگاه شیراز

امیرحسین راسخ

دانشکده مهندسی برق و کامپیوتر دانشگاه شیراز

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

W. B. Frakes and . Baeza-Yates, Information Retrieval: Data Structures ...
C. Bento, A. Cardoso, and G. Dias, Eds., "EPIA 05: ...
M. F. Porter, "An algorithm for suffix stripping, " Program, ...
J. Mayfield and P. McNamee, "Single n-gram stemming, " Procedings ...
M. Melucci and N. Orio, :A novel method for stemmer ...
M. Tashakori, M Meybodi, and F Oroumchian, "Bon : First ...
K. Taghva, R. Beckley, and M. Sadeh, _ stemming algorithm ...
A. H. Jadidinejad, F. Mahmoudi, and J. Dehdar, "Evaluation of ...
L. Dolamic and , Savoy, "Persian Language, Is Stemming Efficient?, ...
O. Kashefi, M. Nasri, K. Kanani, M. Senobari, and S. ...
R. Krovetz, "Viewing morphology as an inference process, " in ...
W. B. Frakes, "Stemming algorithms, " in Information Retrieval Dato ...
M. Ghayoomi, "Bootstrapping the Development of an HPSG based Treebank ...
J. B. Lovins, "Development of a stemming algorithm, " Mechanical ...

نمایش کامل مراجع