کاهش واژه نامه با استفاده از ترکیب توصیف گرها جهت بازشناسی کلمات دستنویس
محل انتشار: همایش ملی مهندسی رایانه و مدیریت فناوری اطلاعات
سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 727
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSITM01_514
تاریخ نمایه سازی: 10 شهریور 1393
چکیده مقاله:
در این مقاله یک روش ترکیبی جدید برای کاهش واژه نامه ارائه شده است که می تواند به عنوان یک عملیات پیش پردازشی برایتشخیص کلمات فارسی و عربی استفاده شود. برای انجام این روش، پس از استخراج مولفه های شکل، تعدادی از آنها را به نقاط وتعدادی دیگر را به بدنهی زیرکلمات نسبت می دهیم. عملیات انتساب نقاط شکل، توسط قوانین از پیش تعریف شده آغاز و در ادامهتوسط یک طبقه بند بررسی می شود. نقاط تایید شده بوسیله طبقه بند، در مرحله بعد و در صورت امکان با هم ترکیب می شوند.در این مقاله، دو توصیفگر نقطه و بدنه همراه با ویژگی تعداد زیرکلمات در یک طرح موازی بکار گرفته می شوند. ورودی های واژهنامه، در مرحله اول، بر مبنای تعداد زیرکلمات، در مرحله دوم بر اساس توصیفگر بدنه و در مرحله سوم بر اساس توصیفگر نقطه ،امتیازدهی می شوند. هر سه مرحله با هم به پیش می روند و کلمات واژه نامه را بطور مستقل امتیازدهی می کنند. سرانجام در مرحلهآخر هر سه لیست امتیاز، با هم ترکیب شده و یک لیست رتبه بندی نهایی ارائه می شود. در اینجا می توان بر اساس آستانه ایمشخص، تعدادی از کلمات واژه نامه را هرس کرد و برای تشخیص دقیقتر به مرحله اصلی بازشناسی فرستاد. این طرح ترکیبی بر روی پایگاه داده IFN/ENIT که شامل 26459 تصویر، از کلمات دستنویس است آزمایش شد و توانست به نرخ کاهش 90 % و دقت 95% دست یابد.
کلیدواژه ها:
نویسندگان
ایمان پورحسین
دانشجوی کارشناسی ارشد هوش مصنوعی، دانشگاه شهید چمران اهواز
علیرضا عصاره
دانشگاه شهید چمران اهواز، دانشیار گروه مهندسی کامپیوتر
بیتا شادگار
دانشگاه شهید چمران اهواز، استادیار گروه مهندسی کامپیوتر
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :