کاربست الگوریتم تخصیص دیریکله پنهان با تنظیم بهینه پارامترها دراستخراج کلمات خبر محور از میکروبلاگ ها
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,024
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
FNCEITPNU02_018
تاریخ نمایه سازی: 19 اردیبهشت 1395
چکیده مقاله:
میکروبلاگ در مقایسه با اسناد خوش ساختار مانند صفحات وب، مقالات خبری و بلاگها یک نوع کاملا متفاوت از متن است که کوتاه و نویزی بوده و این خصوصیات, جمع آوری اطلاعات زمینهای و آماری را برای شناسایی موضوعات مورد نظر سختتر میکند. این پژوهش جنبههای زیر را برای شناسایی اخبار از میکروبلاگها پوشش میدهد: ابتدا خصوصیات متفاوت مانند محتویات، زمینه و فعالیتهای توییتر، از میکروبلاگ بررسی شده و سپس یک مدل تشخیص موضوع با استفاده از تکنیکهای کاوش داده و الگوریتم تخصیص دریکله پنهان ایجاد شده است. در این پژوهش، مدل-سازی کاوش و استخراج متن های کوتاه و شناسایی موضوعات خبری در میکروبلاگ ها بررسی و نحوه کاربست الگوریتم تخصیص دیریلکه پنهان و تنظیم پارامترهای آن با پیاده سازی مدل معرفی شد و در زبان R نشان داده شده است.
کلیدواژه ها:
نویسندگان
حسین پورحیدر توچاهی
دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار دانشگاه آزاد اسلامی واحد رشت
فاطمه احمدی آبکناری
استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات دانشگاه پیام نور رشت
رضا ابراهیمی آتانی
استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات دانشکده ی فنی دانشگاه گیلان