ارزیابی عملکرد سیستمهای پردازش توزیع شده گرافهای مقیاس بزرگ

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 562

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DCBDP05_073

تاریخ نمایه سازی: 6 آذر 1398

چکیده مقاله:

با افزایش حجم اطلاعات، داده های بزرگ در مرکز توجه علوم و تحقیقات قرار گرفته اند. به دنبال آن، ساختارهای بزرگ گراف در مقیاس ترا و پتا بایت که تعداد راسها و یالهای آنها به میلیونها و حتی میلیاردها میرسند، بسیار رایج شدهاند و تجزیه و تحلیل آنها، به زمینه ی پژوهشی در حوزه ی داده های بزرگ تبدیل شده است. با توجه به اندازه و ساختار نامنظم و پراکنده ی گرافهای بزرگ و همچنین ماهیت تکراری الگوریتم های گراف که به منابع و توان محاسباتی زیادی نیاز دارند، پردازش و به دست آوردن دانش از آنها چالش برانگیز است. در سالهای اخیر پژوهشهای زیادی به منظور توسعه ی سیستمهای توزیع شده ی پردازش گراف انجام شده است. ابتدا در سال 2012 گوگل با معرفی پریجل به عنوان سیستمی مقیاسپذیر و مقاوم در برابر خطا، پیشگام این حوزه شده است. از آن زمان، شاهد توسعه ی تعداد زیادی از سیستمهای تخصصی پردازش گراف از جمله آپاچی جیراف، گرافلب، گرافایکس، پاورگراف و بسیاری دیگر هستیم. با گسترش تنوع این سیستمها و وجود گرافها و الگوریتم های با ویژگیهای متفاوت، ارزیابی عملکرد سیستمهای پردازش گراف اهمیت ویژه ای دارد.این مقاله، قابلیت استفاده و عملکرد دو سیستم پردازش گراف آپاچی جیراف و گرافایکس را با اجرای چهار الگوریتم رتبه بندی صفحات، شمارش مثلث، یافتن مولفه های همبندی و جستجوی سطح اول روی شش مجموعه داده ی واقعی از حوزه های کاربردی مختلف از جمله وب، شبکه های اجتماعی و شبکه های استنادی بررسی میکند. در این پژوهش قدرت پردازش، استفاده از منابع و مقیاس پذیری سیستمها مورد ارزیابی قرار گرفته اند. نتایج نشان میدهند هیچکدام از سیستمها دارای عملکرد برتر در تمامی آزمایشها نمی باشند و کارایی سیستمها روی الگویتمها و گرافهای با ویژگیهای متفاوت، متغیر است.

نویسندگان

فاطمه السادات بکائی

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر، دانشگاه یزد، یزد

امیر جهانگردرفسنجانی

استادیار، گروه مهندسی کامپیوتر، دانشگاه یزد، یزد