رتبه بندی صفحات وب در کنار استفاده همزمان کاوش محتوای وب به همراه کاوش نحوه استفاده از آن به منظور یافتن قوانین انجمنی توسعه یافته

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 686

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SENACONF02_316

تاریخ نمایه سازی: 30 آبان 1394

چکیده مقاله:

با افزایش چشمگیر حجم اطلاعات و توسعه وب، نیاز به روش ها وئ تکنیک هایی که بتوانند امکان دستیابی موثر به داده ها و استخراج اطلاعات از آنها را فراهم کنند، بیش از پیش احساس می شود. وب کاوی یکی از زمینه های تحقیقاتی است که با استفاده از تکنیک های داده کاوی به کشف و استخراج خودکار اطلاعات از اسناد و سرویس های وب می پردازد. در واقع وب کاوی، فرآیند کشف اطلاعات و دانش ناشناخته و مفید از داده های وب می باشد. در این مقاله به طراحی، پیاده سازی و ارزیابی الگوریتمی نوآورانه خواهیم پرداخت که به منظور استخراج اطلاعات از داده های دسترسی به وب و همچنین کاوش محتوی وب ارائه می شود. در واقع، با بکارگیری همزمان کاوش محتوای وب سایت دانشگاه آزاده اسلامی واحد دولت آباد (www.iauda.ac.ir) به همراه کاوس نحوه استفاده از آن (استخراج اطلاعات از داده های دسترسی به وب)، قصد داریم به اهداف یافتن اطلاعات مفید و مرتبط، ایجاد دانش جدید و همچنین ارائه پیشنهادات به بازدیدکنندگان و شخصی سازی اطلاعات آن وب سایت دست پیدا کنیم. شخصی سای وب، تجربه وب برای یک کاربر خاص یا مجموعه ای از کاربران، سازمان دهی می کند و پیشنهادات پویایی را بر اساس الگوهای رفتاری آنها ارائه می دهد. در این مقاله که پیش بینی نیازهای آتی بازدید کنندگان بر اساس قوانین انجمنی (Association Rules) صورت می گیرد، در ابتدا به هریک از صفحان وب سایت، به شکلی نوآورانه یک رتبه (Rank) تخصیص داده می شود. رتبه هر صفحه از وب سایت بر اساس دو معیار مشخص می شود: (معیار اول) تعداد لینکهای موجود درسایت که به آن صفحه اشاره دارد. (معیار دوم) تعداد دفعاتی که آن صفحه توسط کاربران مشاهده می گردد. در این صورت، نتایج استخراج شده به شکل قوانین انجمنی توسط این روش جدید و همچنین پیشنهادات ارائه شده به کاربر از دقت و اهیمت بیشتری نسببت به الگوریتم های مشابه برخوردار خواهد بود.

کلیدواژه ها:

داده کاوی ، رتبه بندی صفحات وب ، کاوش محتوای وب ، کاوش استفاده از وب ، قوانین انجمنی ، شخصی سازی

نویسندگان

سلمان طاهری زاده

دانشگاه آزاد اسلامی واحد دولت آباد، گروه کامپیوتر، اصفهان، ایران

بابک نیک مرد

دانشگاه آزاد اسلامی واحد دولت آباد، گروه کامپیوتر، اصفهان، ایران

علا آرمان

دانشگاه آزاد اسلامی واحد دولت آباد، گروه کامپیوتر، اصفهان، ایران

بابک نداف سیچانی

دانشگاه آزاد اسلامی واحد دولت آباد، گروه کامپیوتر، اصفهان، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • E. Alpaydin, "Introduction to Machine Learning", the MIT Press, 2004. ...
  • S. S. Anand, B. Mobasher, "Intelligent Techniques for Web Pers ...
  • R. Baeza-Yates, B. Ribeiro-Neto, "Modern Information Retrieval", Harlow: Addison Wesley ...
  • S. Chakrabarti, "Mining the web (Discovering Knowledge from Hypertext Data)", ...
  • R. Cooley, _ Usage Mining: Discovery and Application of Interesting ...
  • R. Cooley, B. Mobasher, J. Srivastava, "Grouping web page references ...
  • R. Cooley, B. Mobasher, J. Srivastava, "Web mining: Information and ...
  • R. Cooley, B. Mobasher, J. Srivastava, :Data preparation for mining ...
  • R. Cooley, J. Srivastava, B. Mobasher, "Web mining: Information and ...
  • _ O. Etzioni, _ World Wide Web: Quagmire or gold ...
  • U. M. Fayyad, G. Piatetsky- Shapiro, P. Smyth, R. Uthurusamy, ...
  • A. A. Freitas, "Data Mining and Knowledge Discovery with Evolutionary ...
  • J. Han, M. Kamber, "Data mining: Concepts and techniques", 2nd ...
  • H. Kato, T. Nakayama, Y. Yamane, "Navigation analysis tool based ...
  • H. Liu, V. Keselj, "Combined mining of Web server logs ...
  • B. Mobasher, H. Dai, T. Luo, Y. Sun, J. Zhu, ...
  • A. Nanopoulos, D. Katsaros, Y. Manolopoulos, "Exploiting web log mining ...
  • S. Park, N. Suresh, B. Jeong, "S equence-based clustering for ...
  • J. Pei, J. Han, B. Mortazavi-Asl, H. Pinto, Q. Chen, ...
  • _ D. Pierrakos, G. Paliouras, C. Papatheodorou, C. D. Spyropoulos, ...
  • A. Secker, Dissertation Title: "Artificial Immune Systens for Web Content ...
  • A. Ypma, T. Heskes, "Categorization of web pages and user ...
  • نمایش کامل مراجع