CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تعیین حدود جملات در پیکره های متنی زبان فارسی با استفاده از یک روش کارای ارایه شده برای تشخیص فعل

عنوان مقاله: تعیین حدود جملات در پیکره های متنی زبان فارسی با استفاده از یک روش کارای ارایه شده برای تشخیص فعل
شناسه ملی مقاله: ACCSI14_021
منتشر شده در چهاردهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1387
مشخصات نویسندگان مقاله:

مجید ایرانپور مبارکه - دانشگاه علم و صنعت ایران، دانشکده کامپیوتر
بهروز مینایی بیدگلی - دانشگاه علم و صنعت ایران، دانشکده کامپیوتر

خلاصه مقاله:
تشخیص حدود جمله از جمله مهمترین گام های پیش پردازش در کارهای متن کاوی و پردازش زبان طبیعی است. که دقت آن تاثیر مستقیم روی مراحل بعدی دارد. در این مقاله یک روش جدید جهت تعیین حدود جملات در پیکره های متنی زبان فارسی ارایه شده است. یک رهیافت جدید ترکیبی جهت تشخیص فعل در متن که دقت بالایی در حدود 99% را گزارش می کند، استفاده شده و حدود جمله با استفاده از افعال شناسایی شده تعیین می گردد. حداکثر دقت در این روش در حدود 82 درصد به دست آمده است.

کلمات کلیدی:
تعیین حدود جمله، تشخیص فعل، متن کاوی، رفع ابهام هم نویسه ها، n-gram

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/60769/