ارزیابی خودکار جویشگرهای متنی مبتنی بر تجمیع آرا در حوزه وب فارسی

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 552

فایل این مقاله در 7 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IRANWEB02_060

تاریخ نمایه سازی: 9 مرداد 1395

چکیده مقاله:

امروزه با توجه به رشد روز افزون صفحات وب و استفاده فراوان کاربران از جویشگرها به منظور بازیابی اطلاعات از وب، ارزیابی جویشگرها به ویژه در حوزه های بومی بسیار مورد توجه قرار گرفته است. از این رو، در هر کشوری از جمله ایران، جویشگرهایی با تمرکز بر روی حوزه های خاصی از وب توسط محققیق این عرصه به وجود آمده اند که همگی در تلاش اند عملکرد مناسبی در رقابت با جویشگرهای همه منظوره مانند گوگل داشته باشند. از این رو، بحث ارزیـابی جویشگرها به یکی از مباحث مطرح و با اهمیت در حوزه بازیابی اطلاعات تبدیل شده است. در این مقاله، روشی مبتنی بر تجمیع آرا به منظور ارزیابی خودکار جویشگرهای متنی با نام اختصاری VAWSEE ارائه گردیده است. تمرکز اصلی سیستم ارزیابی VAWSEE بر روی حوزه وب فارسی بوده و با توسعه روشی نوین برای شباهت سنجی مبتنی بر محتوا با الهام از راهکارهای تشخیص تقلب سعی در ارزیابی جویشگرهای متنی در این حوزه را دارد. روش پیشنهادی با ارزیابی انسانی بر روی مجموعه پرس و جوهای جمع آوری شده از کاربران محک زده شده است و میزان همبستگی دو روش خودکار و انسانی مورد بررسی قرار گرفته است. نتایج بدست آمده از این آزمایشات حاکی از مناسب و قابل اتکا بودن روش پیشنهادی است.

نویسندگان

فرزانه شعله

گروه سکوهای فناوری اطالعات، پژوهشکده فناوری اطالعات، مرکز تحقیقات مخابرات ایران، تهران

معصومه عظیم زاده

گروه سکوهای فناوری اطالعات، پژوهشکده فناوری اطالعات، مرکز تحقیقات مخابرات ایران، تهران

محمدمهدی یدالهی

گروه سکوهای فناوری اطالعات، پژوهشکده فناوری اطالعات، مرکز تحقیقات مخابرات ایران، تهران

اکبر میرزایی

گروه سکوهای فناوری اطالعات، پژوهشکده فناوری اطالعات، مرکز تحقیقات مخابرات ایران، تهران