دستهبندی و بازیابی تصاویر صفحات اسناد بر مبنای ساختار ظاهری آنها
محل انتشار: یازدهمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1384
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 863
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI11_080
تاریخ نمایه سازی: 5 آذر 1390
چکیده مقاله:
جستجو یک سند خاص در یک پایگاه داده بزرگ از تصاویراسناد اغلب نتایج نامطلوب زیادی تولید میکند. یکی از راههای افزایش کارآیی سیستمهای بازیابی سند, جستجوی اسناد بر مبنای نوع آنها میباشد. طرحبندی ١ ظاهری صفحات عمومًا اطلاعات زیادی را در بر دارد. که میتوان از آنها برای دستهبندی اسناد بر اساس نوع بهره برد. در این مقاله یک روش دستهبندی و بازیابی صفحات اسناد بر مبنای شباهت ظاهری ساختار طرحبندی آنها ارائه کردهایم. ما از ویژگیهایی مانند ساختار ستونی, اندازه فونت, چگالی متن نواحی و ویژگیهای آماری اجزاء پیوسته نواحی استفاده کردهایم, این ویژگیها نیاز به دانش پیشینی در مورد اسناد ندارند. سپس به کمک طبقهبندی کننده درخت تصمیم روش پیشنهادی خود را ارزیابی کردهایم. در ادامه به کمک ساختار خودسازمانده ٢ درختی صفحات را بر مبنای ساختار ظاهری آنها نمایهگذاری ٣ کرده و کارایی این سیستم را ارزیابی کردهایم.
کلیدواژه ها:
دستهبندی تصاویر اسناد ، پایگاه داده تصاویراسناد ، ذخیره و بازیابی تصاویر اسناد ، ساختار طرحبندی ، طبقهبندی کننده درخت تصمیم ، ساختار خودسازمانده درختی
نویسندگان
محمد اکبری
دانشگاه صنعتی امیرکبیر
رضا عزمی
دانشگاه الزهرا