روشی جدید برای قطعه بندی و طبقه بندی تصویر سندی مبتنی بر تبدیل موجک و الگوریتم ژنتیک

سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,974

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI13_243

تاریخ نمایه سازی: 25 آبان 1386

چکیده مقاله:

تبدیل اسناد کاغذی به صورت نسخه الکترونیکی برا ی ذخیره سازی، بازیابی و جستجو بر اساس محتوی مسأله مهمی به شمار می رود،از طرف دیگر در سال های اخیر جهان با رشد فزاینده ای به سمت انتقال و ذخیره سازی اسناد به صورت دیجیتالی درحال پیشروی است.در این مقاله ما به آنالیز نواحی متنی از غیر متنی در سند می پردازیم.برای رسیدن به این مقصود، ابتدا سند قطعه بندی می شود،زیرا قطعه بند ی مرحله مهمی در آنالیز و تشخیص نوع نواحی(متن/تصویر)در سند است، سپس شناسایی مناطق متنی و تصویری توسط طبقه بندها انجام می گیرد،در این راستا برای شناسایی نوع قطعات از ویژگ ی ها ی بافت تصویر استفاده می شود.بدلیل اینکه ابعاد استفاده شده برا ی شناسا یی قطعات توسط طبقه بندها (شبکه عصبی وSVM ) زیاد می باشد،از الگوریتم های تکاملی مانند ژنتیک برای کاهش ابعاد استفاده می کنیم. آزمایشات بر روی ۹۷۷ سند که از اینترنت گرفته شده است انجام شده است .اسناد مورد آزما یش از زبان های مختلف شامل ارسی،انگلیسی،چینی،ژاپنی و یونانی انتخاب شده و در ۹ دسته طبقه بندی شده است.نتایج آزمایشات نشان می دهد که با روش ارا ئه شده قطعات متنی داخل تصاویر یا چسبیده به تصاویر بهتر از سند جدا شده و همچنین باعث کاهش خطا ی تشخیص قطعات متنی می شود،مزیت دیگر ا ی ن روش شناسا یی قطعات تصو یری در سند می باشد. الگوریتم ارائه شده حدود ۹۷.۵ % قطعات را به درستی تشخیص می دهد.

نویسندگان

مهدی فارسی عباس آبادی

کارشناس ارشد،گروه مهندسی کامپیوتر دانشگاه آزاد اسلامی واحد تهران جن

نصرا... مقدم چرکری

استادیار،گروه مهندسی کامپیوتر دانشگاه تربیت مدرس،تهران،ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • _ G. Nagy., *Twenty years of document image analysis in ...
  • A. K. Jain and B. Yu., 4 Document representation and ...
  • N. Amamoto, S. Torigoe, and Y. Hirogaki, ، Block Segmentation ...
  • M. Acharyya and M.K. Kundu, 4Document Image Segmentation Using Wavelet ...
  • A. Busch _ W.W. Boles, S. Sridharan. "Texture for script ...
  • S. Mao and T. Kanungo. "Empirical performance evaluation methodology and ...
  • Y. Qiao, Z. Lu, C. Song and S. Sun. 4.Document ...
  • L.. oGorfan, _ Document Spectrum for Page Layout Analysis, " ...
  • Nagy, G., Seth, S. and Viswanathan, M.: "A prototype document ...
  • A. Jain and Y. Zhong, *Page Segmentation Using Texture Analysis, ...
  • Qixiang Ye, Qingming Huang, Wen Gao and Debin Zhao, 4#Fast ...
  • H.Li, D. Doermann, O. Kia, 4 Autormuatic text detection and ...
  • R. Lienhart, A. Wernicke, "Localizing and segmenting text in images ...
  • نمایش کامل مراجع