بررسی روش های استخراج اطلاعات مبتنی بر یادگیری ماشین و مهندسی دانش

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 762

فایل این مقاله در 10 صفحه با فرمت PDF و WORD قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CITCOMP02_136

تاریخ نمایه سازی: 7 اسفند 1396

چکیده مقاله:

زبان طبیعی ابزار اصلی بیان مفاهیم برای انسان است و گفتار یا نوشتار را می توان رسانه انتقال آن دانست. در مقابل ماشین با این زبان نا آشنا است و نیازمند ترجمه آن به حوزه اطلاعات است. با توجه به اینکه در دهه های اخیر اطلاعات متنی در اینترنت رشد سریعی داشته و بخش قابل توجهی از این اطلاعات (اخبار آنلاین،مقالات علمی وکتب و....) به صورت غیر ساخت یافته و ناهمگن می باشد واطلاعات غیرساخت یافته قابل خواندن، سازماندهی و تحلیل توسط ماشین ها نیستند. برای اینکه بتوان از بین این حجم عظیم اطلاعات، انسان را درفهم و یافتن اطلاعات مورد نیاز یاری کرد باید بتوان متن غیرساخت یافته را به اطلاعات ساخت یافته تبدیل کرد. در نتیجه وجود فناوری استخراج اطلاعات الزامی است. سیستم های استخراج اطلاعات با تبدیل اطلاعات به صورت ساخت یافته فهم آن را برای ماشین آسان و به انسان در درک بهتر این اطلاعات کمک می کنند. در این راستا استخراج اطلاعات دو روش کلی یادگیری ماشین و مهندسی دانش را معرفی می کند. یادگیری ماشین شامل روش های با ناظر که با مقادیر زیادی داده آموزشی کار می کنند، روش های بدون ناظر اغلب از خوشه بندی استفاده می کند و روش های نیمه ناظر با استفاده از هسته ها بوجود آمدند. روش استخراج آزاداطلاعات نیز یکی دیگر از روش ها است که در مواردی که هدف کشف همه حقایق برجسته از متن بزرگ و متنوع است استفاده می شود. مهندسی دانش نیز شامل روش های استخراج الگو که از رویکرد تطبیق الگو برای شناسایی بخش لازم متن استفاده می کند و روش مبتنی بر قاب که در آن متون هم موضوع دریک خوشه قرار می گیرند تا برای هرکدام از آن ها قالبی با نقش های معنایی مشخص شود. هدف ما در این مقاله نقد و بررسی روش های استخراج اطلاعات(یادگیری ماشین و مهندسی دانش) می باشد.

نویسندگان

سمیه حیدری

گروه کامپیوتر، دانشکده کامپیوتر، موسسه آموزش عالی پویش، قم، ایران

زهره بناییان

گروه کامپیوتر، دانشکده کامپیوتر، موسسه آموزش عالی پویش، قم، ایران

وحیده رشادت

پژوهشکده فناوری اطلاعات، دانشگاه صنعتی مالک اشتر، تهران، ایران