ارزیابی فرضیه حذف ابر پیوندهای نویزی با استفاده از دانش استنتاج شده هستی شناسی Dbpedia

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 522

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IKMC08_026

تاریخ نمایه سازی: 25 آذر 1395

چکیده مقاله:

همان طور که داده های وب به سرعت در حال رشد هستند و، ساختار گراف وب که یک نمایش گرافیکی از دنیای وب را نمایش می دهد در حال بزرگ شدن است و به تدریج ساختار محتوایی خود را به یک ساختار غیر محتوایی تأکید کرده است. بسیاری از الگوریتم های بازیک یاغی اطلاعات مانند الگوریتم های لینک بر اساس ساختار گراف وب شکل گرفته اند ولی متأسفانه این الگوریتم هافبک فریب مؤلفه های هرزی مانند ابر پیوندهای نویزی را خورده اند. وجود این دو ابر پیوندها بسیاری از الگوریتم های اساسی بازیابی اطلاعات مانند جست و جو را با مشکل مواجه ساخته و کارایی آن را کاهش داده اند. اگرچه راه حل های زیادی برای برخورد با این داده های شد نویزی وجود دارد اعماق بسیاری از آن ها ساختار معنای این ارتباط را در نظر نمی گیرند. در این مقاله با استفاده از انواع تکنولوژی های وب معنایی مانند کتابخانه جنا، هستی شناسی DBPedia و استدلال گواهان به ساختار معنای لینک هات توجه شده و به پیاده سازی فرضیه ارزیابی حذف ابر پیوندهای نویزی با رویکرد معنایی پرداخته شده است بعد در پایان با توجه به نتیجه معیارهای ارزیابی داده کاوی مانند Precision و Recall به دست بالای رویکرد پیشنهاد شده در حذف ابر پیوندهای نویزی بوده ایم.

نویسندگان

کاظم تقندیکی

کارشناسی ارشد مهندسی کامپیوتر - نرم افزار، دانشگاه اصفهان، دانشکده مهندسی کامپیوتر، گروه مهندسی نرم افزار

احمد زائری

استادیار گروه مهندسی کامپیوتر-نرم افزار ، دانشگاه اصفهان، دانشکده مهندسی کامپیوتر، گروه مهندسی نرم افزار

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Alqurashi, T., & Wang, W. (2014). A Graph based Methodology ...
  • Auer, S., Bizer, C., Kobilarov, G., Lehmann, J., Cyganiak, R., ...
  • Biemann, C., & Quasthoff, U. (2007). Similarity of Documents and ...
  • Chen, M., Mao, S., & Liu, Y. (2014). Big data: ...
  • da Costa Carvalho, A. L., Chirita, P.-A., De Moura, E. ...
  • Davies, J., Sure, Y., Lausen, H., Ding, Y., Stollberg, M., ...
  • Hegde, M. M., & Phatak, M. (2012). Developing an approach ...
  • Li, F. (2008). Extracting Structure of Web Site Based on ...
  • Manning, C. D., Raghavan, P., & Schitze, H. (2008). Introduction ...
  • Munilatha, R., & V enkataramana, K. (2014). A STUDY ON ...
  • Praba, V. L., & Vasantha, T. (2014). Efficient hyperlink analysis ...
  • Qi, X., Nie, L., & Davison, _ _ _ _ ...
  • Sreedhar, G. (2014). A Study On Web Structure Mining. International ...
  • Wang, Y., Chen, X., & Feng, X. (2010). Combating link ...
  • Xing, W., & Ghorbani, A. (2004). Weighted pagerank algorithm. Paper ...
  • C ommunication Networks and Services Research, 2004. Proceedings. Second Annua ...
  • Yi, L, Liu, B., & Li, X. (2003). Eliminating noisy ...
  • ZHENG, Y., CHENG, X.-c., & Kai, C. (2008). Filtering noise ...
  • نمایش کامل مراجع