An Approach to Learn Categorical Distance Based on Attributes Correlation

سال انتشار: 1390
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 1,143

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEE19_556

تاریخ نمایه سازی: 14 مرداد 1391

چکیده مقاله:

Measuring similarity or distance plays a key role for data mining and knowledge discovery tasks. A lot of work has been performed on continuous attributes, but for nominal attributes the similarity computation is not relatively well- understood. In this paper, we propose a novel approach to learn a familyof dissimilarity measures for categorical data. Based on these measures distance between two different values of an attribute can be determined by using the certain number of attributes rather than all attributes at once. We evaluate our methods in unsupervised environment, Experiments with real data show that our dissimilarity estimation method improves the accuracy of K-Modes clustering algorithm

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • C. Stanfill and) Waltz, "Toward memory-based reasoning". Com- mun. ACM, ...
  • Zaki, "Learning ر [2] Jierui Xie, Boleslaw Szymanski, and Mohammed ...
  • D.R. Wilson and T.R. Martinez, "Improved heterogeneous distance functions". J. ...
  • D. Goodall, "A new similarity index based on probability". Biometrics, ...
  • S. Kullback, Information Theory and Statistics", John Wiley and Sons, ...
  • S. Kullback and R. Leibler, "On information and sufficiency", Ann. ...
  • Si Quang Le and Tu Bao Ho, "An as sociation-based ...
  • N. S ondberg -Madsen, C. Thomsen, and J. M. Pena, ...
  • _ _ _ Theory:. Wiley, 1991. ...
  • A. Strehl, _ J. GGhosh and . Cardie, "Cluster ensembles ...
  • _ _ _ _ Research Issues On Data Mining and ...
  • Z. Huang, 'Extensions to the k-Meas Algorithm for Clustering Large ...
  • V. Manganaro, S. Paratore, E. Alessi, S. Coffa, and S. ...
  • P. Andritsos, P. Tsaparas, R. Miller and K Sevcik, 'LIMBO: ...
  • Tools and Techniques, 2nd edn. Data Management Systems. Morgan Kaufmann, ...
  • A.K. Jain and R.C. Dubes, "Algorithms for Clustering Data". Prentice ...
  • against of other distance learning approaches studied in [17] I.H. ...
  • 63=0.091 0.46 =0.011 0.42 =0.029 0.62 =0.031 0.32 =0.201 0.49 ...
  • C. L. Blake, C. J. Merz. UCI repository of machine ...
  • نمایش کامل مراجع