روشی جدید برای قطعه بندی و طبقه بندی تصویر سندی مبتنی بر تبدیل موجک و الگوریتم ژنتیک
محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,974
فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI13_243
تاریخ نمایه سازی: 25 آبان 1386
چکیده مقاله:
تبدیل اسناد کاغذی به صورت نسخه الکترونیکی برا ی ذخیره سازی، بازیابی و جستجو بر اساس محتوی مسأله مهمی به شمار می رود،از طرف دیگر در سال های اخیر جهان با رشد فزاینده ای به سمت انتقال و ذخیره سازی اسناد به صورت دیجیتالی درحال پیشروی است.در این مقاله ما به آنالیز نواحی متنی از غیر متنی در سند می پردازیم.برای رسیدن به این مقصود، ابتدا سند قطعه بندی می شود،زیرا قطعه بند ی مرحله مهمی در آنالیز و تشخیص نوع نواحی(متن/تصویر)در سند است، سپس شناسایی مناطق متنی و تصویری توسط طبقه بندها انجام می گیرد،در این راستا برای شناسایی نوع قطعات از ویژگ ی ها ی بافت تصویر استفاده می شود.بدلیل اینکه ابعاد استفاده شده برا ی شناسا یی قطعات توسط طبقه بندها (شبکه عصبی وSVM ) زیاد می باشد،از الگوریتم های تکاملی مانند ژنتیک برای کاهش ابعاد استفاده می کنیم. آزمایشات بر روی ۹۷۷ سند که از اینترنت گرفته شده است انجام شده است .اسناد مورد آزما یش از زبان های مختلف شامل ارسی،انگلیسی،چینی،ژاپنی و یونانی انتخاب شده و در ۹ دسته طبقه بندی شده است.نتایج آزمایشات نشان می دهد که با روش ارا ئه شده قطعات متنی داخل تصاویر یا چسبیده به تصاویر بهتر از سند جدا شده و همچنین باعث کاهش خطا ی تشخیص قطعات متنی می شود،مزیت دیگر ا ی ن روش شناسا یی قطعات تصو یری در سند می باشد. الگوریتم ارائه شده حدود ۹۷.۵ % قطعات را به درستی تشخیص می دهد.
کلیدواژه ها:
نویسندگان
مهدی فارسی عباس آبادی
کارشناس ارشد،گروه مهندسی کامپیوتر دانشگاه آزاد اسلامی واحد تهران جن
نصرا... مقدم چرکری
استادیار،گروه مهندسی کامپیوتر دانشگاه تربیت مدرس،تهران،ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :