استخراج معنایی رکوردهای داده از صفحات وب توصیف محصول

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,046

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI14_140

تاریخ نمایه سازی: 26 مهر 1387

چکیده مقاله:

با استفاده از سیستم های استخراج اطلاعات می توان پرس و جوهای خود را به جای داده های وب، بر روی اطلاعات ساخت یافته انجام داد. با استفاده از هستان شناسی می توان استخراج اطلاعات را به صورت معنایی انجام داد. در این مقاله به کمک هستان شناسی و با استفاده از معیار آماری واریانس یک روش هوشمند جهت استخراج رکوردهای داده، در صفحات توصیف محصول که نوعی از صفحات وب نیمه ساخت یافته هستند، ارائه شده است. در روش پیشنهادی ابتدا ناحیه اصلی صفحه وب که شامل رکوردهای داده است به کمک هستان شناسی و با استفاده از واریانس تشخیص داده می شود و در مرحله بعد با استفاده از الگوریتم تطبیق برچسب، رکوردهای داده موجود در ناحیه اصلی استخراج می شوند. این روش بر عکس روش های موجود علاوه بر ساختار صفحات وب، محتوای آن ها را نیز درنظر می گیرد و دارای دقت وپوشش بالاتری است.

نویسندگان

امین کشاورزی

عضو هیات علمی دانشگاه آزاد اسلامی

فرزاد پیروی

عضو هیات علمی دانشگاه آزاد اسلامی

امیر مسعود رحمانی

عضو هیات علمی دانشگاه آزاد اسلامی

راضیه کشاورزی

دانشگاه پیام نور