کاربرد و تعدیل قانون زیف و الگوی آماری زو در بازشناسی واژه های بازدارنده زبان فارسی با استفاده از خوشه زبانی مقالات علمی- پژوهشی رشته کتابداری و اطلاع رسانی

سال انتشار: 1392
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 486

فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_LIRJ-3-2_009

تاریخ نمایه سازی: 2 آبان 1396

چکیده مقاله:

هدف: شناسایی و استخراج سیاهه هایی نظام مند از واژه های بازدارنده به منظور استفاده در نمایه سازی خودکار متن های فارسی رشته کتابداری و اطلاع رسانی روش: روش تحلیل محتوا است. جامعه پژوهش، 56 مقاله بودند که 20 مقاله با روش نمونه گیری تصادفی ساده انتخاب شدند. یافته ها: از مجموع 15557 واژه موجود در متن مقالات، مطابق با الگوی زو، قبل از تعدیل واژه ها، 1368 و بعد از تعدیل، 468 واژه؛ مطابق قانون زیف نیز قبل از تعدیل، 217 و بعد از تعدیل، 607 واژه به عنوان واژه بازدارنده شناخته شدند. هم چنین از مجموع 1989 واژه موجود در چکیده مقالات، مطابق با الگوی زو قبل از تعدیل واژه ها، 148 و بعد از تعدیل، 173 واژه و بر اساس قانون زیف، قبل از تعدیل60 و بعد از تعدیل، 186 واژه به عنوان واژه بازدارنده استخراج شدند. در هر دو روش رابطه مستقیمی بین بسامد واژه ها و احتمال بازدارنده بودن آن ها مشاهده شد. بالاترین درصد واژه های بازدارنده (44/39 درصد) بدون احتساب بسامد، در متن مقالات و با کاربرد الگوی آماری زو به دست آمد. نتایج این پژوهش به افزایش کارایی، کاهش حجم فایل درونداد و صرفه جویی در زمان و هزینه ذخیره و بازیابی اطلاعات منجر می شود.

نویسندگان

محمد جواد هاشم زاده

استادیار گروه کتابداری و اطلاع رسانی دانشگاه بیرجند

زینب نخعی

کارشناس ارشد کتابداری و اطلاع رسانی دانشگاه بیرجند

حسین مرادی مقدم

مدرس دانشگاه بیرجند