CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

شناسایی و استخراج الگو ی گراف هم آیی واژگان برای سور با حجم داده هم سان

عنوان مقاله: شناسایی و استخراج الگو ی گراف هم آیی واژگان برای سور با حجم داده هم سان
شناسه ملی مقاله: IRCEM02_125
منتشر شده در دومین کنفرانس ملی تحقیقات بین رشته ای در مهندسی کامپیوتر، برق، مکانیک و مکاترونیک در سال 1396
مشخصات نویسندگان مقاله:

فاطمه علی خواه - دانشجوی کارشناسی ارشد مهندسی فناوری اطلاعات دانشگاه قم
محمدکاظم مویدی - استادیار دانشکده مهندسی مکانیک دانشگاه قم
ایوب ترکیان - دانشیار انستیتو آب و انرژی دانشگاه صنعتی شریف

خلاصه مقاله:
روند فزاینده پیشرفت های فناوری امکان تنوع بخشی به روشهای شناسایی و استخراج ویژگی های داده ها و کشف ارتباط و شیوه اندرکنش آنها در پدیده های دنیای تکوین را بیش از پیش فراهم نموده است. در سالهای اخیر، رویکرد شبکه ای بررسی متون در داده های شبکه های اجتماعی محمل تحلیل رفتاری کاربران قرار گرفته ولی پژوهش های زبان شناسی رایانه ای در این خصوص به تازگی شروع شده است. تشکیل شبکه واژگان قرآن نیز در این راستا قابل توجه است چون امکان سنجش ارتباط و میزان نقش آفرینی آنها در ساختار ظاهری داده ها را تقویت می کند. در این بررسی گراف بدون جهت کلمات هم نشین در آیات 10 سوره با حجم داده یکسان تشکیل و شاخص های مختلف مرکزیت و دانسیته آن ها استخراج گردید. ضمن استفاده از فاصله بین کلمات به عنوان معیار تفکیک واژه، هزینه خاصی برای تفاوت فاصله بین کلمات در یک آیه لحاظ نشد و وزن دهی بر اساس میزان تکرار واژه تعیین گردید. نتایج نشان داد که به منظور تقویت کارایی تحلیل موضوعی واژگان، ضرورت دارد که پیش پردازش داده ها با حذف کلمات دارای تکرار زیاد ولی بدون تاثیر در موضوع یابی از طریق پیاده سازی الگوریتم های بازیابی، انجام شود. علاوه بر این، با توجه به بالا بودن ضریب بودن هم بستگی بین بعضی از شاخص ها، استفاده از روشهای کاهش ابعاد و هم چنین شناسایی و استخراج شاخص های الگوی طیفی گراف ها پیشنهاد گردید.

کلمات کلیدی:
قرآن کاوی ، تیوری گراف ، واژگان ، هم آیی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/700123/