یک سامانه ی نمایه گذاری چند_وزنی توزیع شده برای بهبود بازیابی اطلاعات در زبان فارسی

محدثه دانش; امید کاشفی; بهروز مینایی

یک سامانه ی نمایه گذاری چند_وزنی توزیع شده برای بهبود بازیابی اطلاعات در زبان فارسی

محل انتشار: شانزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

سال انتشار: 1389

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,267

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/133890

شناسه ملی سند علمی:

CSICC16_150

تاریخ نمایه سازی: 28 بهمن 1390

چکیده مقاله:

با توجه به حجم وسیع اطلاعات و نرخ بالای پرس و جو و جریان داده کها مروزه با آن مواجه هستیم نمایه گذاری به عنوان راه حلی برای مبارزه با پیچیدگی ذاتی بازیابی متن و تسریع امر بازیابی اطلاعات درمیان شمار زیادی از زبانهای مختلف مورد توجه قرار گرفته است نمایه گذاری وب فرایند فیلتر اطلاعات دنیای وب است و نمایه گذار پالاینده اطلاعات آن . زبان فارسی یکی از پرکاربردترین زبانهای خاورمیانه است که درکشورهایی نظیر ایران افغانستان و تاجیکستان صحبت می شود بنابراین میزان زیادی از اسناد موجود در وب به زبان فارسی هستند اما متاسفانه تلاش های محدودی درزمینه بازیابی این اسناد صورت گرفته است در این مقاله راهکاری مناسب جهت بازیابی اسناد فارسی با استفاده از نمایه گذاری چند وزنی و با تکنیک توزیع شدگی ارایه شده است نمایه گذاری چند وزنی به عنوان روشی باری پاسخ گویی کاراتر به پرس وجوها مورد توجه قرار گرفته و کیفیت بازیابی اطلاعات را بطور چشمگیری افزایش میدهد.

کلیدواژه ها:

بازیابی اطلاعات ، ریشه یابی ، نمایه گذاری ، چند_وزنی ، توزیع شدگی

نویسندگان

محدثه دانش

دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران،تهران،ایران

امید کاشفی

دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران،تهران،ایران

بهروز مینایی

دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران،تهران،ایران