ریشه یابی در متن و بهبود عملکرد الگوریتم ریشه یابی پورتر

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,914

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

GERMANCONF02_075

تاریخ نمایه سازی: 3 تیر 1398

چکیده مقاله:

هدف بازیابی اطلاعات، فراهم کردن راه هایی برای پیدا کردن اسناد مربوط به نیاز اطلاعاتی کاربران است. ریشه یابی، یکی از تکنیکهای پیشپردازش در متنکاوی و همچنین یک نیاز رایج در کاربردهای مربوط به پردازش زبان طبیعی است و بنابراین در سیستم های بازیابی اطلاعات بسیار حایز اهمیت است. ریشه سازهی اصلی یک کلمه است که در بین تمام کلمات همخانواده آن واژه مشترک است. هدف ریشه یابی پیدا کردن ریشه و سازه ی اصلی کلمه است که این موضوع موجب بهبود عملکرد سیستمهای بازیابی اطلاعات میشود. مثلا در زمینهی موتورهای جستجو، وقتی جستجو با استفاده از ریشه ی کلمات انجام گردد موجب میشود تا تعداد اسناد بازیابی شده افزایش پیدا کند. ریشه یاب پورتر معروفترین و پرکاربردترین ریشه یاب مطرح شده، در زبان انگلیسی است. اما این ریشهیاب نقاط ضعفی را با خود به همراه دارد. در این مقاله، تلاش میشود خطاهای این الگوریتم، شناسایی شده و راهکارهایی برای رفع این خطاها و افزایش قدرت و دقت این ریشهیاب، پیشنهاد شود. امید میرود، با این کار عملکرد این الگوریتم بهبود یافته و موجب افزایش کارایی سیستمهای بازیابی اطلاعات گردد.

نویسندگان

عبداله محمدی

دانشجوی کارشناسی ارشد مهندسی کامپیوتر

منصور امینی لاری

استادیار مهندسی کامپیوتر

هاله همایونی

مربی مهندسی کامپیوتر