CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بهبود برچسب زنی متون فارسی با استفاده از روش های ترکیبی نحوی و معنایی

عنوان مقاله: بهبود برچسب زنی متون فارسی با استفاده از روش های ترکیبی نحوی و معنایی
شناسه ملی مقاله: MAYCOMP02_075
منتشر شده در دومین همایش چشم انداز تکنولوژی کامپیوتر و شبکه در 2030 در سال 1395
مشخصات نویسندگان مقاله:

فریناز رشادی - دانشجوی کارشناسی ارشد ، گروه کامپیوتر ، واحد میبد ، دانشگاه آزاد اسلامی ، میبد ، ایران
محمدجواد کارگر - عضو هیات علمی گروه کامپیوتر ، واحد میبد ، دانشگاه آزاد اسلامی ، میبد ، ایران

خلاصه مقاله:
یکی از ملزومات استفاده از روش های آماری در پردازش زبان طبیعی، دسترسی به داده های زبانی شامل پیکره های متنی، پیکره های درختی، واژگان ها، بانک های صوتی و غیره می باشد. از سوی دیگر، بسیاری از زبان شناسان در پژوهش های خود از پیکره های زبانیبهره می گیرند و به بررسی ویژگی ها و کشف قواعد زبان از طریق اطلاعات موجود در داده های زبانی می پردازند. هدف از این پژوهش، بررسی چالش ها و مشکلات برچسب گذاری خودکار اجزای واژگانی کلام در زبان فارسی و استفاده از پیکره متنی زبان فارسی )پیکرهوابستگی نحوی زبان فارسی(در طراحی یک سیستم، برچسب گذاری می باشد. در این تحقیق، مدل های ترکیبی معرفی خواهند شد که بتوانند دو مسیله ی برچسب زنی اجزای سخن و تجزیه ی وابستگی را به صورت همزمان انجام دهند و در بهبود دقت برچسب زنی، تاثیر مثبتی داشته باشند. در روش پیشنهادی تلاش بر این است که با استفاده از برچسب زن نحوی ومعنایی اجزای کلام، بعد از تعیین نقش کلمات، در مدل یادگیری، برای عملکرد بهتر از چند الگوریتم یادگیری با بهترین دقت استفاده شود. الگوریتمهایی بکار رفته شامل الگوریتم های j48 ,oneR ,bysenet, navebyse میباشند.

کلمات کلیدی:
برچسب گذاری اجزای کلام، پیکره زبان فارسی، تجزیهی وابستگی، برچسب گذاری نحوی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/655033/