ارائه روشهایی برای افزایش دقت در یافتن رکوردهای مشابه از میان اطلاعا ت موجود در پایگاه داده های حجیم

سال انتشار: 1389
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,566

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEIC03_206

تاریخ نمایه سازی: 4 آذر 1389

چکیده مقاله:

دراین مقاله ابتدا روشهای جارو و جارووینکلر مورد بررسی قرار می گیرد بعد بهبودهایی برروی هر دو روش انجام خواهد شد که روشهای بهبود یافته جارو و بهبود یافته جارووینکلر نامیده می شود این روشها حساسیتی نسبت به کاراکترهای مشابه به هم دارند همچنین روش توکن جارو که پیاده سازی خواهد شد براین اساس است که برروی روشجارو بهبود دیگری انجام دهد که توکن وار عمل کند دراین مقاله علاوه برروشهای بهبود یافته جارو و بهبود یافته جارووینکلر و توکن جارو روش دیگری پیشنهاد شده است که کارایی خوبی برای کلمات چندبخشی دارد و دقت بهتری را برای این گونه فیلدها دارا م یباشد و همچنین با درنظرگرفتن شباهتی برای حروف مشابه دقت را در خطاهای تایپی بالا می برد بعد از پیاده سازی این روش ور وشهای دیگر مطرح شده قبلی روی دو پایگاه داده واقعی تست شدند و نتایج را مورد بررسی قرار گرفت که این روش پیشنهادی برروی پایگاه داده ها دقتی در حدود 90 درصد داشت.

کلیدواژه ها:

نویسندگان

محمدرضا فیضی درخشی

گروه کامپیوتر دانشگاه تبریز

ازاده روحانی

گروه کامپیوتر دانشگاه آزاد اسلامی واحد شبستر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • K. Elmagarmid., P. G. Ipeirotis.. V. S. Verykios, "Duplicate record ...
  • Alvaro E. Monge., Charles P.. Elkan., "The Field ...
  • _ _ Record atchingModels, Techniques and Tools" , Scienti_c Report ...
  • _ _ _ Nauk SSSR., vol. 163., no. 4., pp. ...
  • Vishkin, "Fast Parallel and Serial ر [5] G.M. Landau and ...
  • Winkler, W. E, "The state of record linkage and current ...
  • Winkler, W. E, "Overview of Record Linkage and Current Research ...
  • Pierre Nicod eme , "q-gram analysis and urn models", Discrete ...
  • L. Gravano., P.G. Ipeirotis., H.V. Jagadish, N. Koudas., ...
  • IEEEData Eng. Bull., vol. 24, no. 4, pp. 28-34, Dec. ...
  • Andreas FFurer ., "Combining Runtime and Static ...
  • Science ETH Zurich, 2007 ' o-gram ...
  • نمایش کامل مراجع