یک ریشه یاب فارسی مبتنی بر قاعده با استفاده از عبارات منظم
محل انتشار: یازدهمین کنفرانس سراسری سیستم های هوشمند
سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,491
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICS11_109
تاریخ نمایه سازی: 14 مهر 1392
چکیده مقاله:
استخراج خودکار ریشه کلمات یکی از مسائل اساسی و پر اهمیت در پردازش زبان های طبیعی و بازیابی اطلاعات متنی است. در این مقاله انواع رهیافت های رایج در طراحی ریشه یاب ها مورد بررسی قرار گرفته اند. سپس با بررسی قواعد صرفی کلمات در ساخت واژه زبان فارسی به طراحی یک ریشه یاب خودکار پرداخته شده است. ریشه یاب پیشنهادی بر پایه مجموعه ای از قواعد که به صورت عبارات منظم بیان شده اند؛ اقدام به حذف پیشوند و پسوند کلمات می کند. در این مقاله، استثنائات و مسائل موجود در صرف کلمات فارسی بررسی شده و راهی برای حل آنها ارائه شده است. سپس ریشه یاب پیشنهادی مورد آزمایش و مقایسه قرار گرفته، که نتایج آن نشان دهنده ی دقت بسیار بیشتری در مقایسه با ریشه یاب های پیشین است. با توجه به کارهای انجام شده در این زمینه، ریشه یاب پیشنهادی، برای اولین بار به بررسی و حل برخی از مشکلات ریشه یابی در زبان فارسی پرداخته است
کلیدواژه ها:
نویسندگان
حسین تقی زاده
دانشکده مهندسی برق و کامپیوتر دانشگاه شیراز
محمدهادی صدرالدینی
دانشکده مهندسی برق و کامپیوتر دانشگاه شیراز
محمدحسن دیانتی
دانشکده مهندسی برق و کامپیوتر دانشگاه شیراز
امیرحسین راسخ
دانشکده مهندسی برق و کامپیوتر دانشگاه شیراز
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :