CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ریشه یابی در متن و بهبود عملکرد الگوریتم ریشه یابی پورتر

عنوان مقاله: ریشه یابی در متن و بهبود عملکرد الگوریتم ریشه یابی پورتر
شناسه ملی مقاله: GERMANCONF02_075
منتشر شده در دومین کنگره بین المللی علوم و مهندسی در سال 1397
مشخصات نویسندگان مقاله:

عبداله محمدی - دانشجوی کارشناسی ارشد مهندسی کامپیوتر
منصور امینی لاری - استادیار مهندسی کامپیوتر
هاله همایونی - مربی مهندسی کامپیوتر

خلاصه مقاله:
هدف بازیابی اطلاعات، فراهم کردن راه هایی برای پیدا کردن اسناد مربوط به نیاز اطلاعاتی کاربران است. ریشه یابی، یکی از تکنیکهای پیشپردازش در متنکاوی و همچنین یک نیاز رایج در کاربردهای مربوط به پردازش زبان طبیعی است و بنابراین در سیستم های بازیابی اطلاعات بسیار حایز اهمیت است. ریشه سازهی اصلی یک کلمه است که در بین تمام کلمات همخانواده آن واژه مشترک است. هدف ریشه یابی پیدا کردن ریشه و سازه ی اصلی کلمه است که این موضوع موجب بهبود عملکرد سیستمهای بازیابی اطلاعات میشود. مثلا در زمینهی موتورهای جستجو، وقتی جستجو با استفاده از ریشه ی کلمات انجام گردد موجب میشود تا تعداد اسناد بازیابی شده افزایش پیدا کند. ریشه یاب پورتر معروفترین و پرکاربردترین ریشه یاب مطرح شده، در زبان انگلیسی است. اما این ریشهیاب نقاط ضعفی را با خود به همراه دارد. در این مقاله، تلاش میشود خطاهای این الگوریتم، شناسایی شده و راهکارهایی برای رفع این خطاها و افزایش قدرت و دقت این ریشهیاب، پیشنهاد شود. امید میرود، با این کار عملکرد این الگوریتم بهبود یافته و موجب افزایش کارایی سیستمهای بازیابی اطلاعات گردد.

کلمات کلیدی:
بازیابی اطلاعات، ریشه یابی، ریشه یاب پورتر، ریشه یاب لوینس، بهبود ریشه یابی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/878009/