انتخاب نمونه های آموزشی بهینه براساس معیارهای فاصله برای آموزش رده بندی احساسات

سال انتشار: 1399
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 55

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_CSJI-5-3_003

تاریخ نمایه سازی: 14 بهمن 1402

چکیده مقاله:

افزایش چشمگیر دسترس پذیری به نظرها و توصیه های برخط باعث می شود رده بندی احساسات در متون کوتاه یکی از موضوع های جالب توجه در تحقیقات علمی و صنعتی باشد. در زمینه رده بندی احساسات، اصطلاحات به کار برده شده در دامنه های مختلف ممکن است متفاوت باشند. درنتیجه مدلی که با داده های برچسب دار آموزشی (دامنه منبع) یادگیری می شود ممکن است عملکرد خوبی در برچسب گذاری داده های آزمایشی (دامنه هدف) نداشته باشد. یادگیری انتقالی و انطباق دامنه دو راه حل مفید برای مواجهه با این مشکل هستند. یادگیری انتقالی و انطباق دامنه، توزیع های دامنه منبع و هدف را به هم نزدیک می کنند تا عملکرد رده بند در دامنه هدف بهبود یابد اما نکته حائز اهمیت این است که کدام دامنه از مجموعه دامنه های نامزد به عنوان دامنه منبع انتخاب شود. روش پیشنهادی در این مقاله یک ترکیب خطی از معیارهای فاصله بین توزیع دامنه های منبع و هدف است که بهترین دامنه منبع را برای یادگیری رده بند انتخاب می کند. روش پیشنهادی بر روی مجموعه داده های همگن و ناهمگن ارزیابی شده است. همان طورکه نتایج نشان می دهد، مدل پیشنهادی، در مجموعه داده همگن با احتمال ۴۷.۱ درصد (۵.۹ درصد در مدل تصادفی) و در مجموعه داده ناهمگن با احتمال ۲۳.۱ درصد (۸.۳ درصد در مدل تصادفی) می تواند دامنه منبع صحیح را انتخاب کند که حاکی از بهبود چشمگیر عملکرد مدل پیشنهادی نسبت به مدل تصادفی در انتخاب دامنه منبع صحیح است.

نویسندگان

شیوا نوری سرای

دانشجوی کارشناسی ارشد، دانشکده مهندسی فناوری اطالعات و کامپیوتر دانشگاه صنعتی ارومیه ارومیه ایران

جعفر طهمورث نژاد

استادیار دانشکده مهندسی فناوری اطلاعات و کامپیوتر دانشگاه صنعتی ارومیه ارومیه ایران