پردازش اسناد فارسی چند ستونی با تکیه بر آنالیز منطقی

سال انتشار: 1389
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,050

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCSCIT01_087

تاریخ نمایه سازی: 19 بهمن 1390

چکیده مقاله:

استخراج خودکار اطلاعات موجود در اسناد یکی از ضروریات سیست مهای اطلاعاتی محسوب مى شود، که این امر با پرداختن به پردازش اسناد (Document Processing) حاصل می گردد. پرداز ش تصاویر اسناد به دو بخش آنالیز هندسی سند (بررسی چیدمان بلوکهاى سند)وآنالیز منطقی سند(ترتیب خواندن بلوکهاى سند) تقسیم می شود. از آنجائیکه م یتوان ساختار هندسی و منطقی اسناد را به صورت درخت نمایش داد، برای بدست آوردن درخت منطقی سند، کافی است توسط یک سری قوانین درخت ساختار هندسی را به درخت ساختار منطقی تبدیل کرد.در این مقاله تحلیل منطقی برای اسناد فارسی چند ستونی که مبتنی بر روش تبدیل درخت م یباشد، معرفی می گردد. این روش توسط نرم افزار MALAB پیاده سازی گردید و روی 40 سند فارسی از نوع مجله، روزنامه، کتاب، نامه، و مقالات علمی آزمایشهایی انجام گرفت و تنها در 2 مورد خطا مشاهده شد.

نویسندگان

عبدالنبی انصاری اصل

گروه کامپیوتر – دانشگاه آزاد اسلامی واحد دزفول

کریم انصاری اصلی

گروه برق – دانشگاه شهید چمران اهواز

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Y.Y. Tang, S.W. Lee, and C.Y. Sun, :Documm Analysis and ...
  • J. Toyoda, Y. Noguchi and Y. Nishimura, "Study of Extracting ...
  • S. Tsujimoto, H. Asada, _ Understanding Multi-Articled Documents", Proc. 10th ...
  • C.L. Yu, Y.Y. Tang, :Document Architecture Language Approach to Documet ...
  • S. Tsujimoto, H. Asada, "Major Component of complete Text Reading ...
  • L. Cinque, L. Forino, S. Levialdi, L. Lombardi, S. Tanimoto, ...
  • Yasuto Ishitani "Document Layout Analysis Based on Emergent Computation", Proc. ...
  • Mccallum, D. Freitag, and F. Pereira, "Maximum entropy markov models ...
  • Laven, K.; Leishman, S.; Roweis, S., _ statistical learning approach ...
  • B. Gatos, I. Pratikakis, S.J. Perantonis, "Adaptive degraded document image ...
  • نمایش کامل مراجع