CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

شناسایی حروف چاپی فارسی با استفاده از دسته بندهای ماشین بردار پشتیبان

عنوان مقاله: شناسایی حروف چاپی فارسی با استفاده از دسته بندهای ماشین بردار پشتیبان
شناسه ملی مقاله: CITCOMP02_277
منتشر شده در دومین کنفرانس بین المللی پژوهش های دانش بنیان در مهندسی کامپیوتر و فناوری اطلاعات در سال 1396
مشخصات نویسندگان مقاله:

محمدمسعود جاویدی - دانشیار گروه کامپیوتر، دانشگاه باهنر، کرمان، ایران
مرضیه قدیری ترشاب - گروه کامپیوتر، موسسه آموزش عالی بهمنیار کرمان، کرمان، ایران

خلاصه مقاله:
یکی از تحولات عمده یادگیری ماشین، ارایه روش های ترکیبی است که با استفاده از ترکیب نتایج چندین دسته بند جزء، یک دسته بند بسیار دقیق ایجاد می شود. در این مقاله روشی برای ترکیب دسته بندی ها ارایه و بر روی مجموعه ای از حروف چاپی فارسی مورد آزمایش قرار گرفته است. این روش در هر مرحله تکرار، داده های ورودی را به صورت تصادفی به چند دسته تقسیم می کند سپس بر روی هر دسته روش آنالیز اجزای اصلی را اعمال کرده و ویژگی ها را استخراج می کند. بردار ویژگی نهایی از ادغام این ویژگی ها ایجاد و با دسته بند ماشین بردار پشتیبان، آموزش داده می شود. ویژگی این روش نسبت به سایر روش های ترکیبی افزایش همزمان درصد صحت دسته بند پایه و پراکندگی نمونه ها در هر مرحله است. با استفاده از این روش به طور متوسط درصد صحت ماشین بردار پشتیبان برای داده های حروف چاپی فارسی بهبود یافته است.

کلمات کلیدی:
باز شناسایی حروف چاپی فارسی، دسته بندی حروف، استخراج ویژگی ها، ماشین بردار پشتیبان، فناوری Optical Character Reader (OCR)

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/696218/