طبقه بندی صفحات وب مبتنی بر آنتولوژی

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 515

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCONFC01_093

تاریخ نمایه سازی: 13 مهر 1397

چکیده مقاله:

طبقه بندی وب سایت ها همواره یکی از چالش های وب کاوی در بازیابی اطلاعات از وب بوده است. در سال های اخیر استفاده از آنتولوژی به منظور افزایش دقت دسته بندی صفحات وب، مطرح شده است. آنتولوژی ارتباط بین مفاهیم در اسناد وب و دنیای واقعی را مشخص می کند که با این کار اسناد مربوطه توسط ماشین ها قابل پردازش و فهم می شوند و اشتراک گذاری بین عامل ها را تسهیل می نماید. در این مقاله ما یک تکنیک جدید، جهت طبقه بندی صفحات وب مبتنی بر آنتولوژی پیشنهاد می دهیم تا این ک ار را با دقت و صحت بالایی انجام دهد. شناسایی و مقایسه معنا و روابط معنایی و محتوایی بین کلمات صفحه دقت و کارآمدی طبقه بندی را بالاتر خواهد برد. در مرحله اول کلمات یک صفحه وب استخراج و با استفاده از چند فاکتور وزن دهی شده و کلمات کلیدی مشخص می شوند. مرحله دوم میزان شباهت بین کلمات کلیدی از صفحه و آنتولوژی با استفاده از مفهوم IC اندازه گیری می شود. با استفاده از نتایج ا ین اندازه گیری طبقه صفحه مورد نظر را مشخص می گردد.

کلیدواژه ها:

طبقه بندی صفحات وب ، آنتولوژی ، شباهت معنایی

نویسندگان