دسته بندی داده های چند برچسبی با استفاده از وابستگی بین کلاس ها و تخمین تعداد برچسب ها

سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,886

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICS11_020

تاریخ نمایه سازی: 14 مهر 1392

چکیده مقاله:

با افزایش حجم داده ها نیاز به دسته بندی و تحلیل داده ها به صورت خودکار، از جایگاه ویژه ای بر خوردار شده است. در این مقاله به دسته بندی داده های چند برچسبی خواهیم پرداخت. داده های چند برچسبی داده هایی هستند که در آن ها نمونه ها می توانند بیش از یک برچسب داشته باشند. به عبارت دیگر هر نمونه توسط یک بردار از برچسب ها نمایش داده می شود. در این مقاله یک روش مبتنی بر نزدیک ترین همسایگی برای دسته بندی داده های چند برچسبی پیشنهاد شده است. در روش ارائه شده نخست تعداد برچسب ها برای هر نمونه جدید تخمین زده می شود و سپس برای هر نمونه جدید، با استفاده از ارتباط و وابستگی بین برچسب ها، برچسب های آن را پیش بینی می گردد. در این مقاله از دسته بند نزدیک ترین همسایگی به عنوان دسته بند پایه استفاده شده است اما با این تفاوت که برای محاسبه فاصله بین نمونه ها از معیار فاصله اقلیدسی استفاده نمی شود. با ارزیابی روش پشنهادی بر روی مجموعه داده های موجود در حوزه داده های چند برچسبی و مقایسه آن با دیگر روش های مطرح در این زمینه، نشان داده می شود که روش پیشنهادی در مقایسه با روش های دیگر در پیش بینی برچسب های نمونه های جدید، از لحاظ پیچیدگی زمانی و دقت از کارایی بهتری برخوردار است

کلیدواژه ها:

داده های چند برچسبی ، دسته بندی داده ها ، الگوریتم های دسته بندی

نویسندگان

سجاد کمالی

دانشجوی ارشد دانشگاه شریف

حمید بیگی

استاد دانشگاه شریف

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • J. Read, "Scalable Multi-label Classification, " Ph.D. These, Department of ...
  • G. Madjarov, D. Kocev and D. Gjorgijevikj, "an extensive experimental ...
  • _ Tsoumakas and I. Katakis, "Multi label classification An Journal ...
  • Warehousing, Vol. 3, No. 3, pp. 1-13, 2007. ...
  • E. L. Mencia, S. H. Park and J. Furnkra nz, ...
  • classifica tio nNeu ro computing, "in Proceedings of the 18th ...
  • _ _ _ _ phenotype data, "in Proceedings of the ...
  • M. L. Zhang and Z. H. Zhou, "ML-kNN:a lazy learning ...
  • G. Tsoumakas, I. Katakis and P Vlahavas, "Effective and efficient ...
  • G. Tsoumakas and I. P. Vlahavas, "Random k-labelsets: A ensemble ...
  • _ _ _ International Conference on Data Mining, pp. 995-1000, ...
  • نمایش کامل مراجع