رصد و خوشه بندی فازی متون خبری فارسی

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 747

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

MTCONF05_032

تاریخ نمایه سازی: 27 اردیبهشت 1398

چکیده مقاله:

روزانه هزاران سند متنی تولید میشود که این اسناد و مدارک متنی یه عنوان اصلی ترین رسانه در کسب وکارها و نیز انتشار اخبار نقش بازی میکنند. یکی از اساسی ترین محتواهایی که کاربران برای دریافت معناییخاص آن را می جویند، اخبار است. خوشه بندی اسناد متنی باعث تقسیم مجموعه دادهها به خوشه هایکوچکتری شده که دارای شباهت داخلی بسیاری هستند و تفاوت در میان خوشه ها با هم زیاد است. خوشهبندی فازی یکی از دو رویکرد عمدهی خوشه بندی است که برای کشف مدل های فازی از داده های حجیمکاربرد دارد. برچسب زنی مانند خوشه بندی یکی از تکنیک های مدیریت داده های حجیم است که با هدف فهمموضوع و معنای کلی داده به کار میرود. هدف پژوهش حاضر، دریافت معنای چندگانه ی اخبار متنی به زبانفارسی و الصاق برچسب معنایی بر آنها است تا بتوان اسناد متنی پردازش شده را در خوشه هایی که از نظرمعنا به برچسب ها شباهت دارند، جای داد. قلمرو داده های پژوهش مقالات فارسی زبان یک سایت خبری درطول حدود 2 سال اخیر از یکم آبان ماه 1395 تا یکم خرداد ماه 1397 می باشد. این مقالات با تعداد کلی1010046 عدد، با استفاده از کد پایتون و با فرمت Txt جمع آوری و بر روی آنها پژوهش صورت گرفت. نتایجنشان داد: متن کاوی با استفاده از ابزار برنامه نویسی پایتون و کد عاملی نرم افزاری و مدل اجرایی با دقت بالاوب معنایی، متن کاوی، داده کاوی، خوشه بندی و برچسب زنی معنایی انجام شد.

نویسندگان

سحر اسماعیلی شایان

دانش آموخته کارشناسی ارشد مدیریت فناوری اطلاعات، دانشگاه الزهرا، تهران

عباس نظری

دانش آموخته کارشناسی ارشد مدیریت فناوری اطلاعات، دانشگاه الزهرا، تهران

مصطفی اسماعیلی شایان

دانشجوی دکتری مهندسی انرژیهای تجدید پذیر، دانشگاه تربیت مدرس، تهران