استخراج معنایی رکوردهای داده از صفحات وب توصیف محصول
محل انتشار: چهاردهمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,046
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI14_140
تاریخ نمایه سازی: 26 مهر 1387
چکیده مقاله:
با استفاده از سیستم های استخراج اطلاعات می توان پرس و جوهای خود را به جای داده های وب، بر روی اطلاعات ساخت یافته انجام داد. با استفاده از هستان شناسی می توان استخراج اطلاعات را به صورت معنایی انجام داد. در این مقاله به کمک هستان شناسی و با استفاده از معیار آماری واریانس یک روش هوشمند جهت استخراج رکوردهای داده، در صفحات توصیف محصول که نوعی از صفحات وب نیمه ساخت یافته هستند، ارائه شده است. در روش پیشنهادی ابتدا ناحیه اصلی صفحه وب که شامل رکوردهای داده است به کمک هستان شناسی و با استفاده از واریانس تشخیص داده می شود و در مرحله بعد با استفاده از الگوریتم تطبیق برچسب، رکوردهای داده موجود در ناحیه اصلی استخراج می شوند. این روش بر عکس روش های موجود علاوه بر ساختار صفحات وب، محتوای آن ها را نیز درنظر می گیرد و دارای دقت وپوشش بالاتری است.
کلیدواژه ها:
نویسندگان
امین کشاورزی
عضو هیات علمی دانشگاه آزاد اسلامی
فرزاد پیروی
عضو هیات علمی دانشگاه آزاد اسلامی
امیر مسعود رحمانی
عضو هیات علمی دانشگاه آزاد اسلامی
راضیه کشاورزی
دانشگاه پیام نور