شناسایی ماکزیمم کلمات پرتکرار برای زبان های گوناگون

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 425

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCT04_301

تاریخ نمایه سازی: 17 آبان 1396

چکیده مقاله:

یکی از چالشهای موجود بر سر راه شناسایی کلمات پرتکرار، وجود زبانهای بسیار متنوع برای اطلاعات متنی و وابستگی روش های موجود شناسایی کلمات پرتکرار به نوع زبان و ساختار کلامی آن زبان خاص می باشد. لذا هدف این پژوهش، طراحی الگوریتمی مستقل از زبان بهمنظور شناسایی کلمات پرتکرار میباشد. از این رو با تمرکز روی خاصیت تکرار کلمات در هر متن و نسبت تکرار آن در سایر متون این امر انجام شده ا ست و در نهایت ماکزیمم بیشترین تکرار به عنوان کلمه پرتکرار انتخاب میگردد. عملکرد الگوریتم پیشنهادی نیز تو سط معیار نرخ دقت ت ش خیص مورد ارزیابی قرار گرفته ا ست . لازم به ذکر ا ست که این الگوریتم با الگوریتم مبتنی بر گراف مقایسه گردیده ا ست، که نرخ دقت کلی الگوریتم پیشنهادی 82.2 %درصد بوده است

نویسندگان

بهاره هاشم زاده

گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه تربت حیدریه

مجید عبدالرزاق نژاد

گروه کامپیوتردانشکده فنی و مهندسی دانشگاه بزرگمهرقاینات

سیدمحمد جوادی مقدم

گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه بزرگمهر قاینات