سازوکاری برای بهینه سازی استخراج ویژگی برای تشخیص هممرجعی ضمیر و اسم اشاره در زبان فارسی

لادن مداح; بهروز مینایی

سازوکاری برای بهینه سازی استخراج ویژگی برای تشخیص هممرجعی ضمیر و اسم اشاره در زبان فارسی

محل انتشار: پنجمین کنفرانس مهندسی دانش بنیان و نوآوری

سال انتشار: 1397

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 608

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/988924

شناسه ملی سند علمی:

KBEI05_039

تاریخ نمایه سازی: 27 بهمن 1398

چکیده مقاله:

تشخیص هم مرجعی یکی از پایه های مهم در پردازش زبانطبیعی می باشد. کاربردهای مهمی در حوزه هایی مانند پاسخ گویی به سوال،ترجمه ماشین، خلاصه سازی اتوماتیک و استخراج موجودیت نامدار دارد.وظیفه ی تشخیص هم مرجعی حل و فصل عبارت های اسمی و ضمایر در متناست که به موجودیت یکسان ارجاع می دهد. روش های تشخیص هم مرجعیرا می توان به دو دسته ی روش های زبان شناسی و روش های یادگیری ماشینتقسیم نمود. روش های زبان شناسی بیشتر به اطلاعات زبانشناسی نیاز دارند،البته مشکلی که این روشها دارند این است که احتمال خطا در آنها بیشتراست همچنین اجرای این روشها زمان بر می باشند، درحالی که روش هاییادگیری ماشین کمتر به اطلاعات زبانشناسی نیاز دارند. در این مقالهسیستمی ارائه می شود که اسم های هم مرجعی موجود در متن را شناساییکرده و با درنظرگرفتن ویژگی های مشخص شده نمونه های مثبت و منفی رااز پیکره استخراج می کند. از جمله نوآوری هایی که انجام شد اضافه کردنویژگی هایی به سیستم می باشد که از آن ها برای عمل تشخیص مرجعضمیر استفاده می شود. این ویژگی ها از نقش نحوی عبارت اسمی کاندید وضمیر استفاده کرده است. با تغییر دادن این ویژگی ها در سیستم دربهترین حالت میتوان به دقت 59.4 درصد دست پیدا کردیم.

کلیدواژه ها:

پردازش زبان طبیعی ، پیکره زبان فارسی ، تشخیص مرجع ضمیر ، یادگیری ماشین

نویسندگان

لادن مداح

دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت استان تهران تهران، ایران

بهروز مینایی

دانشکده مهندسی کامپیوتر،دانشگاه علم و صنعت استان تهران تهران، ایران