پردازش اسناد فارسی چند ستونی با تکیه بر آنالیز منطقی
محل انتشار: اولین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات
سال انتشار: 1389
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,050
فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCSCIT01_087
تاریخ نمایه سازی: 19 بهمن 1390
چکیده مقاله:
استخراج خودکار اطلاعات موجود در اسناد یکی از ضروریات سیست مهای اطلاعاتی محسوب مى شود، که این امر با پرداختن به پردازش اسناد (Document Processing) حاصل می گردد. پرداز ش تصاویر اسناد به دو بخش آنالیز هندسی سند (بررسی چیدمان بلوکهاى سند)وآنالیز منطقی سند(ترتیب خواندن بلوکهاى سند) تقسیم می شود. از آنجائیکه م یتوان ساختار هندسی و منطقی اسناد را به صورت درخت نمایش داد، برای بدست آوردن درخت منطقی سند، کافی است توسط یک سری قوانین درخت ساختار هندسی را به درخت ساختار منطقی تبدیل کرد.در این مقاله تحلیل منطقی برای اسناد فارسی چند ستونی که مبتنی بر روش تبدیل درخت م یباشد، معرفی می گردد. این روش توسط نرم افزار MALAB پیاده سازی گردید و روی 40 سند فارسی از نوع مجله، روزنامه، کتاب، نامه، و مقالات علمی آزمایشهایی انجام گرفت و تنها در 2 مورد خطا مشاهده شد.
کلیدواژه ها:
نویسندگان
عبدالنبی انصاری اصل
گروه کامپیوتر – دانشگاه آزاد اسلامی واحد دزفول
کریم انصاری اصلی
گروه برق – دانشگاه شهید چمران اهواز
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :