CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

استخراج دانش از پایگاه های داده تحت وب عمیق با استفاده از وابستگی کاوی

عنوان مقاله: استخراج دانش از پایگاه های داده تحت وب عمیق با استفاده از وابستگی کاوی
شناسه ملی مقاله: IDMC01_039
منتشر شده در اولین کنفرانس داده کاوی ایران در سال 1386
مشخصات نویسندگان مقاله:

شهره آجودانیان - دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد نجف آباد
محمد داورپناه جزی - عضو هیئت علمی دانشکده برق و کامپیوتر دانشگاه صنعتی اصفهان؛ استاد مدع
محمدحسین سرایی - عضو هیئت علمی دانشکده برق و کامپیوتر دانشگاه صنعتی اصفهان؛ استاد مدع

خلاصه مقاله:
اخیرا شاهد رشد سریع پایگاههای داده تحت وب هستیم. به منظور مدلسازی و یکپارچهسازی پایگاههای داده تحت وب اولین مسئله که باید به آن پرداخته شود این است که واسط پرسوجو چگونه عمل میکند یا یک منبع چه قابلیتهای پرسوجویی فراهم میکند. رویکردی که استفاده میشود بر پایه این اصل است که چارچوب کلی واسطهای پرسوجو شبیه یکدیگر هستند. پس از استخراج دانش از پایگاههای داده تحت وب با استفاده از روش پارسینگ واسط پرسوجو، از الگوریتمهای داده کاوی به منظور تطبیق تعداد زیادی شِما دریک زمان در پایگاههای داده استفاده میشود. این الگوریتمها از یک طرف سرعت تطبیق اطلاعات را بالا میبرند و از طرف دیگر بر خلاف رویکردهای رایج تطبیق که تطبیقهای یکبهیک بین صفات انجام می دهند، قادرند بین صفات تطبیقهای چندبهچند انجام دهند. صفات خاصه در پایگاههای داده را در دو دسته قرار میدهیم. صفات مترادف که به ندرت در یک واسط پرسوجو با هم به کار میروند و صفات گروهی که تقریبا همیشه در یک واسط پرسوجو با هم به کار میروند و به این ترتیب میتوانیم صفات وابسته را در واسطهای پرسوجو با استفاده از رویکرد وابستگی کاوی پیدا کنیم. در رویکرد ارائه شده در این مقاله الگوریتم وابستگی کاوی جدیدی ارائه شده است که قادر است با هزینه کمتری از لحاظ زمان و مصرف حافظه صفات وابسته را پیدا کند. در این الگوریتم از میزانJaccard به منظور یافتن وابستگیهای مثبت و منفی بین صفات استفاده شده است.

کلمات کلیدی:
استخراج دانش، پایگاههای داده تحت وب عمیق، وابستگی کاوی، پارسینگ واسط پرسوجو، تطبیق معانی با استفاده از الگوریتمهای داده کاوی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/33016/