New approach for web page classification based on URL and semantic analysis

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 447

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NSOECE05_002

تاریخ نمایه سازی: 10 تیر 1396

چکیده مقاله:

Traditional information retrieving methods use keywords occurring in determine the class of web pages, but usually retrieved unrelated web pages. W3 consortium stated that HTML dosnt provide a better description of semantic structure of the web page contents, because of its limited semi structure data, case sensitivity, predefined tags and so on. To overcome these backs, Web developers started to develop web pages on XML, flash kind of new technologies. It makes a way for new research methods. In this article we propose a new approach based on URL and semantic analysis for classifying XML and other types of web page.

نویسندگان

Maide Abedini Bagha

Young Researchers and Elite club, Tabriz Branch, Islamic Azad University, Tabriz, Iran

Somayeh Dahmardeh Kemmak

Islamic Azad University, Zahedan, Iran

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Krishna Murthy. A, Suresha, ":XML URL classification based on their ...
  • Apte, C., Damerau, F. & Weiss, S.M., :text mining with ...
  • S. Gunn, "support vector machines for classification and regression, " ...
  • T. Joachims, _ categorization with support vector machines: Learfhing with ...
  • S. Tan, ne ighb or-weighted K-nearest neghbor for unbalanced text ...
  • Sheikhi, F. Abedini Bagha, M. Allah Dadi, L, "Novel approach ...
  • Jinh Park, Sungwoo Lee, Hey Wuk Jung _ Jee Hyong ...
  • Yue Lu, Qiaozhu Mei. Cnangxiang Zhai, "Investigating task performance of ...
  • mohammed j. Zaki, Charu C. Aggarwal XRules, "an effective algorithm ...
  • xinyue Liu, Xianchao Zhang, Ye Tain, "web page segmentation based ...
  • Tagarelli, A. Greco, S., _ semantic XMI clustering, " in ...
  • gloss Overlaps as a Measure of Semantic Reletedness, " in ...
  • نمایش کامل مراجع