استفاده از تکنیک های حفاری وب جهت استخراج صفحاتی با بیشترین تشابه به صفحه مورد نظر

زهرا شعاعی شیره جینی; پروین عابدی; نغمه حیدری

استفاده از تکنیک های حفاری وب جهت استخراج صفحاتی با بیشترین تشابه به صفحه مورد نظر

محل انتشار: دهمین کنفرانس دانشجویی مهندسی برق ایران

سال انتشار: 1386

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 997

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/127594

شناسه ملی سند علمی:

ISCEE10_227

تاریخ نمایه سازی: 7 آذر 1390

چکیده مقاله:

با افزایش و رشد وب، داده های موجود در آن به سرعت در حال افزایشند در طی ده سال اخیر حجم عظیمی از داده ها ی مورد نیاز انسان در وب ذخیره شده است. علی رغم حجم عظیم داده های در دسترس در وب، طبق آمارهای اعلام شده تقریبا ٩٩ % داده های موجود برای ، ٩٩ % کاربران بدون استفاده می باشد. به طور کلی استخراج اطلاعات از وب نیازمند استفاده از تکنیک هایی مثل پردازش زبان طبیعی ١ بازیابی اطلاعات ٢، پایگاه داده ها ٣، یادگیری ماشین ٤، حفاری داده ٥و...است در این مقاله در ابتدا به مبحث حفاری وب ٦خواهیم پرداخت و شاخه های مختلف آن را مطرح کرده و در انتها الگوریتمی مطرح خواهیم کرد که بر اسا س ساختار فراپیوندی میان صفحات شبیهترین صفحه به صفحه مد نظر را می یابد. جهت ارزیابی الگوریتم مطرح شده از دادگانی که از سایتPersian blog جمع آوری شده استفاده نمودیم. مقایسه نتایج حاصل از روش پیشنهادی با نتایج حاصل از google نشان دهنده حدود ٨٠ % همپوشانی با نتایج موتور جستجوگرgoogle است.

کلیدواژه ها:

حفاری داده ، حفاری وب ، جستجو هوشمند در وب ، صفحات مشابه

نویسندگان

زهرا شعاعی شیره جینی

تهران آزاد دانشگاه صنعتی شریف

پروین عابدی

دانشگاه آزاد اسلامی واحد شوشتر

نغمه حیدری

دانشگاه جندی شاپوراهواز

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Kosala and Blockel :Web mining research: A survey. SIGDD: SIGKDD ...
C. Faloutsos, R. Barber, M. Flickner, J. Hafiner, W. Niblack, ...
Usage Mining: Discovery and Application Webء [5] R. Cooley. of ...
Y. Chen and E. Koutsofios. Webciao:"A website visualization and tracking ...
J. M. Kleinberg. Authoritative SOufCeS in a hyperlinked environmen. Journal ...
clustering for the web uSage automaticء [8] M.arnoux mining" In ...
J.R. Quinlan, :C4، 5: Programs for machine learning" _ Morgan ...
J. Ris San en, 'Modeling by Shortest Data Description", Automatica, ...
R. Srikant and Y Yang, "Mining Web Logs to Improve ...
J. Han and K. Chang, "Data Mining for Web Intelligence?, ...
R. Barrett, P. Maglio, D. Kellem, _ to personalize the ...
R. Botafogo, E. Rivlin, B. Shneiderman, :Structural analysis of hypertext: ...
I. V. Cadez, D. Heckerman, C. Meek, P. Smyth, and ...
Y. Fu, K. Sandhu, and M. Shih."A generali zation-based approach ...
F. SAauberlich an K.-P. Hube. :A framework for web ...
Annual Conference of the Gesellschaft fAur Klassi- kation e.V., March ...
J. Borges and M. Levene." Data mining of user navigation ...
M. S. Chen, J. Han, and P. S. Yu. "Data ...
M. N. Garofalakis, R. Rastogi, S. Seshadri, and K. Shi. ...

نمایش کامل مراجع