شناسایی و استخراج الگو ی گراف هم آیی واژگان برای سور با حجم داده هم سان

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 586

فایل این مقاله در 17 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IRCEM02_125

تاریخ نمایه سازی: 7 اسفند 1396

چکیده مقاله:

روند فزاینده پیشرفت های فناوری امکان تنوع بخشی به روشهای شناسایی و استخراج ویژگی های داده ها و کشف ارتباط و شیوه اندرکنش آنها در پدیده های دنیای تکوین را بیش از پیش فراهم نموده است. در سالهای اخیر، رویکرد شبکه ای بررسی متون در داده های شبکه های اجتماعی محمل تحلیل رفتاری کاربران قرار گرفته ولی پژوهش های زبان شناسی رایانه ای در این خصوص به تازگی شروع شده است. تشکیل شبکه واژگان قرآن نیز در این راستا قابل توجه است چون امکان سنجش ارتباط و میزان نقش آفرینی آنها در ساختار ظاهری داده ها را تقویت می کند. در این بررسی گراف بدون جهت کلمات هم نشین در آیات 10 سوره با حجم داده یکسان تشکیل و شاخص های مختلف مرکزیت و دانسیته آن ها استخراج گردید. ضمن استفاده از فاصله بین کلمات به عنوان معیار تفکیک واژه، هزینه خاصی برای تفاوت فاصله بین کلمات در یک آیه لحاظ نشد و وزن دهی بر اساس میزان تکرار واژه تعیین گردید. نتایج نشان داد که به منظور تقویت کارایی تحلیل موضوعی واژگان، ضرورت دارد که پیش پردازش داده ها با حذف کلمات دارای تکرار زیاد ولی بدون تاثیر در موضوع یابی از طریق پیاده سازی الگوریتم های بازیابی، انجام شود. علاوه بر این، با توجه به بالا بودن ضریب بودن هم بستگی بین بعضی از شاخص ها، استفاده از روشهای کاهش ابعاد و هم چنین شناسایی و استخراج شاخص های الگوی طیفی گراف ها پیشنهاد گردید.

نویسندگان

فاطمه علی خواه

دانشجوی کارشناسی ارشد مهندسی فناوری اطلاعات دانشگاه قم

محمدکاظم مویدی

استادیار دانشکده مهندسی مکانیک دانشگاه قم

ایوب ترکیان

دانشیار انستیتو آب و انرژی دانشگاه صنعتی شریف