شباهت معنایی جملات فارسی با استفاده از تطبیق فضای برداری و یادگیری عمیق

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 747

فایل این مقاله در 21 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICTI04_062

تاریخ نمایه سازی: 20 مهر 1400

چکیده مقاله:

امروزه، شناسایی متون مشابه، موضوعی با کاربردهای فراوان می باشد که با توجه به اهمیت آن توسط پژوهشگران زبان های مختلف مورد تحلیل و بررسی قرار گرفته است. در گذشته اغلب برای درک جملات توسط سیستم های کامپیوتری، جملات به صورت مجموعه کلمات مورد بررسی قرار می گرفتند. اما امروزه با گسترش فناوری و استفاده از شبکه های عصبی عمیق، می توان از خود جملات، مفهوم اصلی را استخراج نمود. بنابراین، رسیدن به مدلی که بتواند جملات را کدگذاری کرده و مفهوم اصلی جمله را با دقت هرچه بیشتر استخراج نماید، یکی از نیازهای ضروری برای این هدف به شمار می رود. این مقاله قصد دارد تا میزان شباهت جملات را از نقطه نظر معنایی بدست آورد که از روش های یادگیری عمیق استفاده می کند. از آنجایی که روش های یادگیری عمیق نیاز به داده آموزشی زیادی دارند. این مقاله از ایده نگاشت بین زبانی بهره می برد. روش پیشنهادی، فضای برداری تعبیه کلمات انگلیسی را به فارسی نگاشت کرده و با کمک مدل آموزش داده شده در زبان انگلیسی، شباهت جملات فارسی به دست می آید. در نهایت، نتایج نهایی با امتیازات انسانی مورد مقایسه قرار گرفته است. نتایج حاصل از روش پیشنهادی، میزان دقت این سیستم پیشنهادی را ۸۹ درصد ارائه می دهد که نسبت به سایر مدل های یادگیری عمیق برتری دارد.

نویسندگان

مینا حاجی غلامرضا

دانشگاه صنعتی مالک اشتر، ایران

سیعده سادات سدیدپور

دانشگاه صنعتی مالک اشتر، ایران

محمدرضا محمدزاده

دانشگاه صنعتی مالک اشتر، ایران