استخراج خودکار رده بندی موجودیت های اسمی با استفاده از گراف شمول معنایی

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 651

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CCCI08_015

تاریخ نمایه سازی: 14 دی 1394

چکیده مقاله:

موضوع تشخیص واحد های اسمی در متن و تعیین نوع طبقه ی آنها یکی از مسائل مهم و کاربردی در حوزه ی پردازش زبان های طبیعی و همچنین بازیابی اطلاعات است. به طور کلی تشخیص واحد های اسمی و همچنین طبقه ی آنها در متن دارای فراز و فرود هایی از ابتدا تا به امروز بوده است. با پیشرفت روزافزون در حوزه ی پردازش متن قابلیت انتخاب یک طبقه ی تعیین شده برای موجودیت های اسمی افزایش یافت و دیگر روش های قدیمی تر برای تعیین یک طبقه بندی کلی برای اسامی راه گشای بعضی از نیاز های این حوزه نبود. در این مقاله روشی برای استخراج دسته بندی هر موجودیت اسمی با استفاده از ساخت گراف شمول معنایی از یک متن بدون ساختار ارایه داده شده است . گراف شمول معنایی گرافی است که رازهای آن مفاهیم کلیدی موجود در متن و یالهای آن بیانگر وجود رابطه شمول معنایی بین دو مفهوم می باشد . رابطه شمول معنایی به رابطه ی بین دو مفهوم گفته می شود که در آن یکی از مفاهیم از لحاظ معنایی شامل مفهوم دیگر باشد. رابطه شمول معنایی به دو دسته کل - جز و عام - خاص تقسیم می شود، رابطه کل - جز به رابطه ای گفته می شود که در آن یکی از مفاهیم جزی از مفهوم دیگر باشد مانند رابطه بین تیم و بازیکن رابطه ی عام-خاص به رابطه ی گفته می شود که در آن یکی از مفاهیم از لحاظ معنایی شامل مفهوم دیگر باشد مانند رابطه شهر و تهران . در کارهای قبلی گراف شمول معنایی، با استفاده از کلمات موجود در متن ساخته شده است. ولی در این مقاله گراف شمول معنایی بر اساس معانی کلمات ساخته می شود. در این مقاله یک روش جدید برای ساخت گراف و همچنین استخراج روابطی که صراحتا در متن وجود ندارند ارایه شده است. نتایج بدست آمده در این مقاله بیانگر این است که منابع دانش رده بندی لغوی مانند وردنت که به صورت دستی ساخته شده است را می توان به صورت خودکار استخراج کرد

کلیدواژه ها:

هوش مصنوعی ، رده بندی موجودیت های اسمی ، گراف شمول معنایی ، پردازش زبان های طبیعی ، رفع ابهام

نویسندگان

مسعود پیریایی

دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه صنعتی مالک اشتر

حسن شیرازی

دانشیار و عضو هیات علمی دانشگاه صنعتی مالک اشتر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • J. M. Riley, M. R. Endsley 2 _ Computer- Aided ...
  • R. Leaman, G. Gonzalez, et al., "BANNER: An executable survey ...
  • A. Mansouri, L. Affendy, and A. Mamat, "A New Fuzzy ...
  • _ Marius Pas.ca, "Acquisition of Categorized Named Entities for Web ...
  • Roxana C. Girju, Adriana Badulescu, and Dan Moldova. Learning semantic ...
  • Patrick Pamtel and Deepak Ravichandra. Automatically labeling semantic classes. In ...
  • Roxana Girju, Adriana Badulescu, and Dan Moldovan. Automatic discovery of ...
  • Marti Hears. Automatic acquisition of hyponyms from large text corpora. ...
  • David Yarowsky. Unsupervised word sense disambiguation rivaling supervised methods. In ...
  • Rosie Jones, Andrew Mccallum, Kamal Nigam, and Ellen Riloff Bootstrapping ...
  • Ellen Riloff and Jessica Shepherd. A corpus-based approach for building ...
  • Patrick Pantl and Marco Pemnacchiott Espresso: leveraging generic patterns for ...
  • Yang, Hui, and Jamie Callan. "A metric-based framework for automatic ...
  • Sergei Brin. Extracting patterns and relations from the World Wide ...
  • Navigli, Roberto, Paola Velardi, and Stefano Farall "A graph-based algorithm ...
  • joint conference on Artificial Intel ligence-Volume Volume Three. AAAI Press, ...
  • Kozareva, Zornitsa, and Eduard Hovy. "A semi- supervised method to ...
  • David Yarowsky. Unsupervised word sense disambiguation rivaling supervised methods. In ...
  • نمایش کامل مراجع