ارایه الگوریتم جدیدoptimized-RAKEبرای استخراج عبارات کلیدی

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 657

فایل این مقاله در 20 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEITCONF01_026

تاریخ نمایه سازی: 26 مرداد 1397

چکیده مقاله:

استخراج عبارات کلیدی به عنوان هسته پردازش های خودکاری است که روی داده های متنی انجام می شود. بنابراین در الگوریتمهای متنکاوی استخراج عبارات کلیدی از اهمیت ویژه ای برخوردار است. در واقع استخراج عبارات کلیدی یک مرحله بنیادی از اکثر پروژه های متن کاوی است، که تحقیق بر روی آن و پیدا کردن بهترین روش استخراج عبارات کلیدی که دقت و سرعت مناسبی داشته باشد، اهمیت ویژه ای دارد. در این مقاله، الگوریتم جدیدی ارایه میگردد که علاوه بر سرعت بالای استخراج عبارات کلیدی، دارای دقت مناسبی نسبت به سایر الگوریتمهای موجود در این زمینه میباشد . در این مقاله یک لیست بهینه و مناسب برای کلمات زاید ارایه میشود که دقت و سرعت حذف کلمات زاید از متن ورودی را افزایش میدهد. همچنین برای استخراج عبارات کلیدی مناسب از رویکرد پردازش زبانی استفاده شده است، که در این رویکرد با دو روش نحوی و لغوی عبارات کاندید مناسب را جهت پردازش و استخراج عبارات کلیدی، مشخص مینماید. علاوه بر بهینه سازی هایی که در بالا ذکر شد، در این مقاله، بهینه سازیهایی روی الگوریتمRAKEانجام داده و الگوریتم جدیدی به نامoptimized-RAKE ارایه میگردد. نتایج مقایسه الگوریتم مورد نظر با تعدادی از الگوریتم های مطرح در این حوزه، حاکی از عملکرد بهتر این الگوریتم میباشد

نویسندگان

علی محمدی حسن کیاده

دانشجوی کارشناسی ارشد، دانشگاه علم و صنعت ایران

سعید پارسا

دانشیار دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران

قربان شیخکانلوی میلان

دانشجوی دکترا، دانشگاه آزاد اسلامی واحد شبستر