بهبود تصحیح غلط املایی در زبان کردی با تغییر وزندهی در کمترین فاصله ویرایشی

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,079

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSCG02_012

تاریخ نمایه سازی: 7 اسفند 1396

چکیده مقاله:

دراین مقاله روشی برای تصحیح خودکارغلط های املایی زبان کردی ارایه شده است درروش پیشنهادی ازSoundex برای کدگذاری کلمات وپیشنهادکلمات کاندید برای تصحیح غلط املایی استفاده شده است برای اولویت دادن به کلمات پیشنهادی نخست فاصله ویرایشی لونشتاین به کارگرفته شد سپس با تغییر درهزینه ی جایگزینی حروف ویژه ی زبان کردی نرخ تصحیح خطا و کارایی سیستم افزایش داده شد برای آزمودن الگوریتم ارایه شده یک مجموعه آزمون با تعداد 399 کلمه دارای خطای املایی جمع اوری گردیده است برای ایجادفرهنگ لغات کردی گزینش کلمات براساس تعداد تکرار وقواعد زبانی انجام گرفته تا ازقرارگیری واژه نامعتبر درفرهنگ لغات جلوگیری شود درروش پیشنهادی نسبت به روشهای عمومی برای دیگرزبانها مانند لونشتاین درنرخ تصحیح خطا 3.76 درصد بهبود داشته و وجود کلمه ی درست دراولین پیشنهاد 10.03 درصد بهبود یافته است

نویسندگان

آرش امانی

دانشجوی کارشناسی ارشد، دانشگاه آزاد واحد علوم و تحقیقات تهران، تهران

عباس کوچاری

استادیار، دانشگاه آزاد واحد علوم و تحقیقات تهران، تهران