یک روش ترکیبی برای فشرده سازی شاخص معکوس

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,116

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSITM01_248

تاریخ نمایه سازی: 10 شهریور 1393

چکیده مقاله:

ذخیره سازی حجم بسیار بالای داده های وب که روز به روز بر حجم آن نیز افزوده می شود حجم شاخص معکوس را افرایش داده وسازندگان موتور جستجو را بر آن داشته که تمهیدی جهت رفع این مشکل بیاندیشند. چالش های پیش آمده به رسانه ذخیره سازیمعطوف نشده، بلکه سرعت واکشی اطلاعات را نیز (بدلیل واکشی حجم زیاد اطلاعات( کاهش می دهد. در این راستا الگوریتم ها وروشهای مختلف با فشرده سازی مناسب سعی در کوچکتر ساختن فضای مصرفی حافظه می کنند که این امر می تواند مشکلاتپیش آمده را تا حدودی برطرف سازد. در این مقاله ابتدا به چگونگی شکل گیری شاخص معکوس می پردازیم، سپس با معرفی انواعروش های فشرده سازی، نقاط ضعف و قوت آنها را بررسی می کنیم و الگوریتم جدیدی را که حاصل ترکیب و اصلاح دو الگوریتمفشرده سازی است ارائه خواهیم داد. با اعمال این الگوریتم جدید بر روی پیکره های استاندارد نشان خواهیم داد که روش پیشنهادیاز لحاظ ضریب تراکم نسبت به روش های قبلی بهتر عمل می کند، هر چند زمان بازگشایی الگوریتم در فرآیند واکشی اطلاعاتاندکی افزایش می یابد.

کلیدواژه ها:

فشرده سازی ، دی گپ ، موتور جستجو ، فشرده سازی شاخص معکوس ، سیستم های واکشی اطلاعات

نویسندگان

فریدون عابدی

دانشجوی ارشد نرم افزار دانشگاه علوم و تحقیقات لرستان

سیدعبدالمجید موسوی

استاد هیئت علمی دانشگاه لرستان

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Anh V.N, Moffat A., (2006); "Improved word-aligned binary compression for ...
  • Aroyuelo, D.Gonzalez, S.Oyarzun, (2013); "Document identifier reassigmment and run-length compressed ...
  • Ding Bolin, Zhao Bo, Cux Lin, Han Jiawei, Zhai Cheng ...
  • Glory V. and Domnic S., (2012); "Inverted Index Compression Using ...
  • Hao Wu, Guoliang Li, Lizhu Zhou, (2013); "Ginix: Generalized inverted ...
  • Hui Li, Cun-hua Li, Shu Zhang, Yun Hu, Xia Wang, ...
  • Liu Xiaozhu, (2010); 'Efficient maintenance scheme of inverted index for ...
  • nd International Conference on Future Computer and C ommunication (ICFCC) ...
  • Mouratidis. K., , HweeHwa Pang, "Efficient Evaluation of Continuous Text ...
  • _] S omasundaram, K and Dommic, S..(2007); 'Extended Golomb code ...
  • New Algorithm for Data Compression Optimization", International Journal of Advanced ...
  • The UCI Repository collection databases.(20 13); http://rchive. ics .uci , ...
  • 4]Yong-wang Wei, Qing-hai Ding, Hai-bo Luo, (2010); "Improved Rice Algorithm ...
  • Zhang Shu, Li Hui, Li Cun-hua, Hu Yun, Wang Xia, ...
  • نمایش کامل مراجع