برچسب زنی اجزای سخن در زبان فارسی با استفاده از شبکه عصبی کانولوشن

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 484

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

COMCONF07_250

تاریخ نمایه سازی: 22 مرداد 1399

چکیده مقاله:

مشخص نمودن نقش دستوری کلمات یک جمله (برای مثال اسم، فعل و مفعول) برچسب زنی اجزای سخن نامیده می شود. ابزارهای برچسب زنی معمولا درکاربردهای مختلف پردازش زبان از جمله ترجمه ماشینی، تجزیه دستوری و اصلاح غلط های نوشتاری مورد استفاده قرار میگیرند. تحقیقات زیادی در زمینه برچسب زنی اجزای سخن در زبانهای مختلف انجام شده است ولی با توجه به متفاوت بودن قوانین دستوری و مورفولوژیکی زبان فارسی محققین این زبان، با چالش های خاصی مواجه می باشند. روش های برچسبزنی موجود از مدل های مختلف زبانی و آماری بهره برده اند. این مقاله برای دستیابی به دقت مناسب در برچسبزنی اجزای سخن، از شبکه عصبی کانولوشن CNN استفاده می نماید. مدل پیشنهادی معرفی شده، در ارزیابی انجام شده، به دقت 98/55 درصد دست یافته است.

کلیدواژه ها:

نویسندگان

عرفان رحمانی

گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی ارومیه، ارومیه، ایران

سیامک سرمدی

استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی ارومیه، ارومیه، ایران