استخراج اطلاعات از کانال های اخبار در رسانه اجتماعی توییتر

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,922

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

KAUCEE01_212

تاریخ نمایه سازی: 29 مهر 1396

چکیده مقاله:

رسانه های اجتماعی به کاربران خود امکان میدهند که با یکدیگر از طریق چندین ابزار نظیر چت، جلسات بحث، بیان نظرات و غیره ارتباط برقرار کنند. این منجر به یادگیری و به اشتراک گذاری اطلاعات مهم در میان کاربران می شود. ماهیت اطلاعات روی چنین وب سایت های شبکه اجتماعی را می توان به صورت مستقیم به دو دسته غیر ساخت یافته و نیمه ساخت یافته تقسیم بندی کرد. در مباحث منظم روزانه معمولا قواعد نوشتاری، گرامر و ساختار جمله نادیده گرفته می شوند. این ممکن است باعث انواع ابهام ها در سطوح مختلف لغوی، نحوی و معنایی گردد که تحلیل و استخراج الگوهای داده را از چنین مجموعه داده هایی مشکل می کند. هدف این مطالعه تحلیل داده های مستخرج از Twitter و یافتن اطلاعات جالبتوجه از چنین داده هایی در قالب شکل های مختلف می باشد. حدود 30،000 توییت از صفحات مربوط به 15 کانال خبری روی Twitter استخراج و تجزیه و تحلیل شدند. تکنیک های مختلف متن کاوی بر روی داده های جمع آوری شده به کار گرفته شدند. یافته ها حکایت از آن داشتند که NYT دارای بیشترین توییت روی Twitter است، پس از آن اخبار BBC و CTV قرار دارند. نتایج تجربی نشان داد که بیشترین کلمات مربوط به برنامه هسته ای ایران بودند. سایر موارد و چشم انداز آینده در درون این پژوهش ارایه شدند.

نویسندگان

سینا دامی

استادیار، دانشگاه آزاد اسلامی، واحد تهران غرب، گروه کامپیوتر، تهران، ایران

سینا منصوری

دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی، واحد تهران غرب، گروه کامپیوتر، تهران، ایران