استخراج اطلاعات از کانال های اخبار در رسانه اجتماعی توییتر

سینا دامی; سینا منصوری

استخراج اطلاعات از کانال های اخبار در رسانه اجتماعی توییتر

محل انتشار: کنفرانس ملی پژوهش های نوین در برق، کامپیوتر و مهندسی پزشکی

سال انتشار: 1396

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,922

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > متن کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/658232

شناسه ملی سند علمی:

KAUCEE01_212

تاریخ نمایه سازی: 29 مهر 1396

چکیده مقاله:

رسانه های اجتماعی به کاربران خود امکان میدهند که با یکدیگر از طریق چندین ابزار نظیر چت، جلسات بحث، بیان نظرات و غیره ارتباط برقرار کنند. این منجر به یادگیری و به اشتراک گذاری اطلاعات مهم در میان کاربران می شود. ماهیت اطلاعات روی چنین وب سایت های شبکه اجتماعی را می توان به صورت مستقیم به دو دسته غیر ساخت یافته و نیمه ساخت یافته تقسیم بندی کرد. در مباحث منظم روزانه معمولا قواعد نوشتاری، گرامر و ساختار جمله نادیده گرفته می شوند. این ممکن است باعث انواع ابهام ها در سطوح مختلف لغوی، نحوی و معنایی گردد که تحلیل و استخراج الگوهای داده را از چنین مجموعه داده هایی مشکل می کند. هدف این مطالعه تحلیل داده های مستخرج از Twitter و یافتن اطلاعات جالبتوجه از چنین داده هایی در قالب شکل های مختلف می باشد. حدود 30،000 توییت از صفحات مربوط به 15 کانال خبری روی Twitter استخراج و تجزیه و تحلیل شدند. تکنیک های مختلف متن کاوی بر روی داده های جمع آوری شده به کار گرفته شدند. یافته ها حکایت از آن داشتند که NYT دارای بیشترین توییت روی Twitter است، پس از آن اخبار BBC و CTV قرار دارند. نتایج تجربی نشان داد که بیشترین کلمات مربوط به برنامه هسته ای ایران بودند. سایر موارد و چشم انداز آینده در درون این پژوهش ارایه شدند.

کلیدواژه ها:

متن کاوی ، استخراج اطلاعات ، کانال اخبار ، رسانه اجتماعی ، Twitter

نویسندگان

سینا دامی

استادیار، دانشگاه آزاد اسلامی، واحد تهران غرب، گروه کامپیوتر، تهران، ایران

سینا منصوری

دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی، واحد تهران غرب، گروه کامپیوتر، تهران، ایران