An Efficient Set of Parts of Speech in Persian Information Retrieval Systems

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 1,170

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCC01_251

تاریخ نمایه سازی: 9 فروردین 1395

چکیده مقاله:

Even though the ultimate aim of any information retrieval system is to fulfill its users’ expectations, reducing index storage size and enhancing the system performance are sometimes infinitely preferable, especially for small-sized companies suffering from a lack of hardware resources. For such companies, it is of paramount importance to remove noninfomative terms from their indeces. Selecting a proper set of terms makes it possible to reduce the index storage size and consequently enhance the retrieval performance. In this paper, using parts of speech tagging, we show how to reduce the index storage size without losing precision. Through an experimental process and using Hamshahri corpora, we identify the most effective parts of speech in Persian language. Results demonstrate improvements in the resposnse time and precision of the retrieval.

نویسندگان

Mohammad Ali Yaghoub Zadeh Fard

Iran University of Science and Technology

Saeed Rahmani

Shiraz University

Omid Kashefi

Iran University of Science and Technology

Behrouz Minaei idgoli

Iran University of Science and Technology

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Intern ational _ «1m Infimatin Techn _ _ _ _ ...
  • Manning, C., et al., Foundations of Statistical Natural Language Processing. ...
  • Barr, C., R. Jones, and M. Regelson, The linguistic structure ...
  • Lewis, D.D. and K.S. Jones, Natural language processing for information ...
  • Strzalkowski, T., Natural language information retrieval. Information Processing & Management, ...
  • Strzalkowski, T., Natural Language Information Retrieval. 1999: Kluwer Academic Publishers. ...
  • Kao, A. and S.R. Poteet, Natural Language Processing and Text ...
  • Chowdhury, A. and M. McCabe, Improving Information Retrieval Systems using ...
  • Kanaan, G., R. al-Shalabi, and M. Sawalha, Improving Arabic Information ...
  • Diner, B. and B. Karaoglan, The Effect of Part-of-Speech Tagging ...
  • Harksoo Kim, K.k., Jungyun Seo and Gary Geunbae Lee, A ...
  • Zhai, C., Fast Statistical Parsing of Noun Phrases for Document ...
  • Klavans, J.L. and M.-Y. Kan, The Role of Verbs in ...
  • Karimpour, R., et al., Improving Persian information retrieval Systems using ...
  • Shannon, C.E. and W. Weaver, A Mathematicd Theory of Commun ...
  • Allan and Raghavan, Using Part-of-speech Patterns to Reduce Query Ambiguity. ...
  • نمایش کامل مراجع