استفاده از برچسب های پیشرفته در تجزیهگرهای مبتنی بر گرامر درخت-افزایشی

سال انتشار: 1385
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,452

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI12_315

تاریخ نمایه سازی: 23 دی 1386

چکیده مقاله:

قدرت بالای مدلسازی جملات زبان طبیعی توسط گرامر های درخت-افزایشی سبب شد که از آنها در کاربرد های ترجمه ماشینی و پردازش معنایی استفاده شو د. ولی است فاده از این مدل با دو مشکل اصلی روبرو است، سرعت پائین تجزیه نحوی و وجود ابهامات متعدد در نتایج تجزیه گ ر. بطوریکه استفاده از این گرامر را در کاربرد های واقعی با مشکل جدی مواجه کرده است. بدین دلیل از یک روش تجزیهگر جزئی مبتنی بر این مدل با نام برچس بگذار پ یشرفته استفاده شده است . برخلاف مدل گرامری سابق، خروجی الگوریت مهای تجزیهگر مبتنی بر برچس بها ی پیشرفته بصورت درخ تهای نحوی جزئی است که در کل ساختار جمله تجزیه نمیگردد و بخشهایی از ساختار خروجی آن با خطاهایی مواجه است. در این مقاله، سعی شده است که در د و فاز تشخیص و تصحیح خطا، ساختار های خطادار در مرحله اول تشخیص و سپس با ساختار نحوی درست آن جایگزین گرد د. عملا هم از سرعت مناسب برچسب گذار پیشرفته استفاده شده است و هم خروجی تجزیه کامل گرامر درخت -افزایشی ایجاد می گردد . نتایج بر روی پایگاه درختی Pennحاکی از دقت نزدیک به ۸۰ % بدون ابهام و با سرعت تجزیه قبول است.

نویسندگان

هشام فیلی

عضو هیئت مدیره شرکت داده پردازان دوران

محسن عرب سرخی

مسئول تحقیق و توسعه، گروه پردازش زبان طبیعی، شرکت داده پردازان دوران