شناسایی حروف چاپی فارسی با استفاده از دسته بندهای ماشین بردار پشتیبان

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 631

فایل این مقاله در 15 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CITCOMP02_277

تاریخ نمایه سازی: 7 اسفند 1396

چکیده مقاله:

یکی از تحولات عمده یادگیری ماشین، ارایه روش های ترکیبی است که با استفاده از ترکیب نتایج چندین دسته بند جزء، یک دسته بند بسیار دقیق ایجاد می شود. در این مقاله روشی برای ترکیب دسته بندی ها ارایه و بر روی مجموعه ای از حروف چاپی فارسی مورد آزمایش قرار گرفته است. این روش در هر مرحله تکرار، داده های ورودی را به صورت تصادفی به چند دسته تقسیم می کند سپس بر روی هر دسته روش آنالیز اجزای اصلی را اعمال کرده و ویژگی ها را استخراج می کند. بردار ویژگی نهایی از ادغام این ویژگی ها ایجاد و با دسته بند ماشین بردار پشتیبان، آموزش داده می شود. ویژگی این روش نسبت به سایر روش های ترکیبی افزایش همزمان درصد صحت دسته بند پایه و پراکندگی نمونه ها در هر مرحله است. با استفاده از این روش به طور متوسط درصد صحت ماشین بردار پشتیبان برای داده های حروف چاپی فارسی بهبود یافته است.

کلیدواژه ها:

باز شناسایی حروف چاپی فارسی ، دسته بندی حروف ، استخراج ویژگی ها ، ماشین بردار پشتیبان ، فناوری Optical Character Reader (OCR)

نویسندگان

محمدمسعود جاویدی

دانشیار گروه کامپیوتر، دانشگاه باهنر، کرمان، ایران

مرضیه قدیری ترشاب

گروه کامپیوتر، موسسه آموزش عالی بهمنیار کرمان، کرمان، ایران