An efficient hierarchical method for text region extraction in degraded document images
محل انتشار: پنجمین کنفرانس ماشین بینایی و پردازش تصویر
سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 2,538
فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICMVIP05_046
تاریخ نمایه سازی: 29 اردیبهشت 1387
چکیده مقاله:
This paper presents a clustering based method to extract text regions from degraded document images. In this method the gray scale image is decomposed into four sub-bands using discrete wavelet transform. For each pixel, the corresponding components of 3 detail sub-bands are considered as feature vector. Potential text regions are extracted by k-means clustering algorithm. We propose several heuristic constrains by which candidate text regions are refined to eliminate non-text regions. Evaluation over a set of degraded documents captured with camera, our method shows satisfactory results.
کلیدواژه ها:
نویسندگان
M valizadeh
Department of Electrical Engineering, tarbiat modares university,Tehran, Iran
E kabir
Department of Electrical Engineering, tarbiat modares university,Tehran, Iran
S jalili
Department of Electrical Engineering, tarbiat modares university,Tehran, Iran
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :