خوشه بندی متون کوتاه با یادگیری عمیق ویژگی
سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 951
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
KAUCEE01_219
تاریخ نمایه سازی: 29 مهر 1396
چکیده مقاله:
با توجه به محبوبیت روزافزون و افزایش تعامل کاربران رسانه های اجتماعی از طریق متون کوتاه محاوره ای، خوشه بندی این نوع متون به یک وظیفه مهم تبدیل شده است. خوشه بندی متون کوتاه متفاوت از خوشه بندی متون رایج، به دلیل تنک بودن بازنمایی متن در آن به یک مشکل چالش برانگیز تبدیل شده است. در این مقاله، یک روش خوشه بندی متون کوتاه از طریق یادگیری عمیق با شبکه عصبی پیجیده پویا DCNN پیشنهاد شده است. روش پیشنهادی، با اعمال یک محدودیت در ویژگی های یادگیرنده از طریق یک چارچوب یادگیری خودآموز بدون استفاده از برچسب خارجی سودمند عمل می کند. نخست، ویژگی های کلیدی اصلی در کدهای باینری فشرده با حفظ محدودیت های محلی تعبیه می شوند. سپس، تعبیه کلمات برای یادگیری ویژگی های عمیق با واحدهای خروجی مطابق با کد دودویی از پیش آموزش دیده شده در فرایند یادگیری بررسی شده و به شبکه های عصبی پیچیده منتقلمی شوند. درنهایت، این بازنمایی از ویژگی های عمیق با استفاده از الگوریتم k میانگین خوشه بندی می شوند. نتایج ارزیابی برروی مجموعه داده های پرسش TREC و DBpedia نشان از برتری روش بازنمایی پیشنهادی در مقایسه با سایر روش های بازنمایی متون کوتاه دارد.
کلیدواژه ها:
نویسندگان
سینا دامی
استادیار، دانشگاه آزاد اسلامی، واحد تهران غرب، گروه کامپیوتر، تهران، ایران
مصطفی هاشمی
دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی، واحد تهران غرب، گروه کامپیوتر، تهران، ایران