برچسب زنی اجزای سخن در زبان فارسی با استفاده از شبکه عصبی کانولوشن

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 631

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CITCOMP05_039

تاریخ نمایه سازی: 22 مرداد 1399

چکیده مقاله:

مشخص نمودن نقش دستوری کلمات یک جمله (برای مثال اسم، فعل و مفعول) برچسب زنی اجزای سخن نامیده میشود. ابزارهای برچسب زنی معمولا درکاربردهای مختلف پردازش زبان از جمله ترجمه ماشینی، تجزیه دستوری و اصلاحغلط های نوشتاری مورد استفاده قرار می گیرند. تحقیقات زیادی در زمینه برچسب زنی اجزای سخن در زبان های مختلف انجامشده است ولی با توجه به متفاوت بودن قوانین دستوری و مورفولوژیکی زبان فارسی محققین این زبان، با چالش های خاصیمواجه می باشند. روش های برچسبزنی موجود از مدل های مختلف زبانی و آماری بهره برده اند. این مقاله برای دستیابیبه دقت مناسب در برچسب زنی اجزای سخن، از شبکه عصبی کانولوشن CNN استفاده می نماید. مدل پیشنهادی معرفی شده، در ارزیابی انجام شده، به دقت 98/55 درصد دست یافته است.

کلیدواژه ها:

نویسندگان

عرفان رحمانی

گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی ارومیه، ارومیه، ایران

سیامک سرمدی

استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی ارومیه، ارومیه، ایران