روش جدید برای شناسایی خودکار زبان درمتون دو زبانه فارسی و انگلیسی با قلم های متفاوت تا سطح کلمه

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 692

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

COMCONF05_534

تاریخ نمایه سازی: 21 اردیبهشت 1397

چکیده مقاله:

در متون چابی که شامل چندین زبان نوشتاری میباشد.شناسایی زبان نوشتاری اولین گام در سیستم شناسایی نوری حرو میباشد. در این مقاله یک روش جدید و موثر برای شناسایی زبان نوشتاری خطوط و کلمات در متون چابی دو زبانه فارسی و انگلیسی روبش شده ارایه شده است.ابتدا خطوط متنی و کلمات از تصویر جداسازی میشوند و سپس برای جداسازی این دو زبان و استخراج ویژگیها از دو روش مبتنی بر طرح پروفایل افقی استفاده شده است . در روش اول نسبت میانگین به واریانس تعداد نقاط روشن از هر کلمه نسبت به محیط محاط شده را محاسبه میکنیم و در تکنیک دوم هر خط به سه ناحیه بالایی،میانی و پایینی تقسیم می شود که آنگاه نقطه ماکسیمم مطلق و بزرگترین نقطه ماکسیمم نسبی بعدی ناحیه میانی را بر اساس پروفایل افقی بدست میآوریم. خطوط نوشتاری و کلمات با قلم ها و اندازه های متفاوت برای تست سیستم پیشنهادی استفاده شدهاند. این الگوریتم بر روی 75 صفحه روبش شده متفاوت که شامل 1250 خط متنی و 20400 کلمه از دو زبان نوشتاری میباشد بادقت99,85تست شده است.

کلیدواژه ها:

شناسایی زبان نوشتار ، متون چند زبانه چابی ، شناسایی نوری حروف ، شناسایی زبان فارسی و انگلیسی

نویسندگان

عین اله حاتمی

دانشجوی دکتری هوش مصنوعی و رباتیکز،گروه کامپیوتر،دانشکده فنی و مهندسی، واحد تهران شمال،تهران

مهدی صادق زاده

استادیار،گروه کامپیوتر، واحد ماهشهر،دانشگاه آزاد اسلامی، ماهشهر