ارائه روشی برای استخراج کلمات کلیدی در زبان فارسی
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,215
فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ITCC02_273
تاریخ نمایه سازی: 21 شهریور 1395
چکیده مقاله:
کلمه (یا واژه) واحد سازنده ی متن است و هر کلمه تشکل یافته از واج به عنوان کوچک ترین بخش از نوشتار است. تشخیص نقش و اهمیت کلمه و رابطه ی بین کلمات، شاخص های مهمی در کاوش متن می باشند که کلید حل مسائل مشخصی در پردازش متن است. از این رو در تمامی سیستم های پردازش اطلاعات، کلمه و روابط بین کلمات، پردازش می شود. در این پژوهش روشی جدید برای استخراج کلمات کلیدی با استفاده از ویژگی های آماری و بردار رخداد کلمه در هر متن، ارائه شده است. این روش برای زبان فارسی بر روی متن منفرد و بدون درنظر گرفتن دامنه ی موضوعی متون اجرا می شود. این پیاده سازی با مجموعه دده ی تشکیل شده برای این پژوهش که دربرگیرنده ی 100 مقاله ی معتبر فارسی است، ارزیابی و با کلمات کلیدی مشخص شده توسط نویسنده هر مقاله مقایسه شده است و معیارهای بازیابی و دقت محاسبه شده برای کل مجموعه داده نتایج قابل توجهی را نشان می دهد.
کلیدواژه ها:
نویسندگان
معین معادی
کارشناس ارشد مهندسی فناوری اطلاعات، دانشگاه پویندگان دانش چالوس
کاظم فولادی قلعه
دانشکده مهندسی برق و کامپیوتر، پردیس دانشکده های فنی، دانشگاه تهران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :