CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

یک سیستم بازیابی اطلاعات متنی برای زبان فارسی

عنوان مقاله: یک سیستم بازیابی اطلاعات متنی برای زبان فارسی
شناسه ملی مقاله: IDMC04_100
منتشر شده در چهارمین کنفرانس داده کاوی ایران در سال 1389
مشخصات نویسندگان مقاله:

شیرین حسن زاده - عضو هیئت علمی دانشگاه آزاد اسلامی واحد مرودشت

خلاصه مقاله:
یک سیستم بازیابی اطلاعات به منظور پردازش ذخیره سازی منابعی از اطلاعات و بازیابی آنها یی که با نیازهای یک کاربر مطابقت دارند طراحی می شود با افزایش روزافزون حجم اطلاعات برروی شبکه های اطلاعاتی مانند اینترنت نیاز به سیستمهای دقیق و هوشمند برای بازیابی اطلاعات نیز افزایش می یابد. اسناد فارسی بخشی از این حجیم عظیم اطلاعات هستند که برای تسهیل در استفاده کاربران فارسی زبان از آنها بایستی سیستم های بازیابی اطلاعات متنی با کارایی مناسب طراحی و ایجاد شوند. دراین مقاله سعی شده است یک سیستم بازیابی اطلاعات متنی با استفاده از مدل بازیابی فضای برداری و روشهای مختلف وزندهی به واژ] ها برای زبان فارسی طراحی شود برخلاف تحقیقات قبلی که از مجموعه های اسنادکوچک و غیراستاندارد برای سنجش کارایی سیستم بازیابی اطلاعات استفاده کرده اند. دراین پژوهش کارایی سیستم طراحی شده با استفاده از مجموعه همشهری که در حال حاضر تنها مجموعه اسناد بزرگ و با مشخصه های اماری قابل قبول برای زبان فارسی است مورد بررسی قرارگرفته است.

کلمات کلیدی:
سیستم بازیابی اطلاعات متنی، زبان فارسی، ریشه یابی، نمایه گذاری معنایی پنهان، نمایه گذاری مفهومی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/109098/