یک سامانه ی نمایه گذاری چند_وزنی توزیع شده برای بهبود بازیابی اطلاعات در زبان فارسی

سال انتشار: 1389
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,267

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSICC16_150

تاریخ نمایه سازی: 28 بهمن 1390

چکیده مقاله:

با توجه به حجم وسیع اطلاعات و نرخ بالای پرس و جو و جریان داده کها مروزه با آن مواجه هستیم نمایه گذاری به عنوان راه حلی برای مبارزه با پیچیدگی ذاتی بازیابی متن و تسریع امر بازیابی اطلاعات درمیان شمار زیادی از زبانهای مختلف مورد توجه قرار گرفته است نمایه گذاری وب فرایند فیلتر اطلاعات دنیای وب است و نمایه گذار پالاینده اطلاعات آن . زبان فارسی یکی از پرکاربردترین زبانهای خاورمیانه است که درکشورهایی نظیر ایران افغانستان و تاجیکستان صحبت می شود بنابراین میزان زیادی از اسناد موجود در وب به زبان فارسی هستند اما متاسفانه تلاش های محدودی درزمینه بازیابی این اسناد صورت گرفته است در این مقاله راهکاری مناسب جهت بازیابی اسناد فارسی با استفاده از نمایه گذاری چند وزنی و با تکنیک توزیع شدگی ارایه شده است نمایه گذاری چند وزنی به عنوان روشی باری پاسخ گویی کاراتر به پرس وجوها مورد توجه قرار گرفته و کیفیت بازیابی اطلاعات را بطور چشمگیری افزایش میدهد.

نویسندگان

محدثه دانش

دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران،تهران،ایران

امید کاشفی

دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران،تهران،ایران

بهروز مینایی

دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران،تهران،ایران