بررسی ویژگی های استفاده شده جهت استخراج ویژگی در بازشناسی متون فارسی

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 564

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF04_021

تاریخ نمایه سازی: 24 شهریور 1397

چکیده مقاله:

بازنمایی تصاویر مهم ترین نقش را در سیستم های بازشناسی حروف ایفا میکند. در ساده ترین حالت، تصاویر سطح خاکستری یا باینری به یک بازشناسی کننده داده می شوند. لیکن در بیشتر سیستم های بازشناسی بمنظور اجتناب از پیچیدگی اضافی و افزایش دقت الگوریتم ها، یک روش بازنمایی فشرده تر و با قدرت تمایز بیشتر مورد نیاز می باشد. برای این منظور مجموعه ای از ویژگی ها هر کلاس استخراج میشوند که به تشخیص آن از سایر کلاس ها کمک می گیرد.به عبارت دیگر در این مرحله از داده های ورودی و یا زیرکلمات ورودی مشخصاتی که بیان کننده ویژگی آنها باشد واختلاف بین آنها را بهتر بیان کند استخراج می شود. این مشخصات به صورت ویژگی های توصیف کننده هر حرف و یا زیرکلمه می باشد. بنابراین از این مرحله به بعد هر جز متن با یک بردار ویژگی به رایانه معرفی می شود.و هر سیستم بازشناسی این بردارها را در مرحله آموزش فرا می گیرد و در حافظه خود ذخیره می کند. ویژگی های انتخاب شده بایستی نسبت به اعوجاج ها و تغییرات احتمالی که کاراکترها در یک کاربرد خاص پیدا کنند، تغییرناپذیر باشند. همچنین این مسیله را نیز باید مد نظر قرار داد که آیا حروف یا کلماتی که می بایست تشخیص داده شوند جهت و اندازه مشخصی دارند یا خیر، دستنویس یا چاپی هستند، و یا ممکن است تا چه حد بوسیله نویز مغشوش شده باشند. از طرف دیگر در مورد حروفی که به چندین شکل نوشته می شوند. مانند ’A‘ و ’a‘ ممکن است لازم باشد که بیش از یک کلاس الگو به یک کاراکتر خاص تعلق یابد. در این پژوهش به بررسی ویژگی های انتخاب شده جهت تشکیل بردار ویزگی در چندین مقاله و پژوهش در زمینه بازشناسی حروف و کلمات فارسی پرداخته شده است.

نویسندگان

اسماعیل ابراهیمی

گروه کامپیوتر ، دنشکده مکاترونیک ، واحد علوم و تحقیقات تهران (پردیس البرز) ،دانشگاه آزاد اسلامی،کرج،ایران

علیرضا نیک روان شلمانی

استاد گروه کامپیوتر، دانشگاه آزاد اسلامی واحد کرج، کرج، ایران