CIVILICA We Respect the Science
ناشر تخصصی کنفرانسهای ایران
عنوان
مقاله

سازه پرداز: واژه بندی و یکسان سازی متون فارسی با رویکرد پیکره - محور

اعتبار موردنیاز PDF: ۱ WORD: ۶ | تعداد صفحات: ۱۵ | تعداد نمایش خلاصه: ۶۳ | نظرات: ۰
سال انتشار: ۱۳۹۶
کد COI مقاله: CITCOMP02_259
زبان مقاله: فارسی
حجم فایل: ۳۲۱.۸ کیلوبایت (فایل این مقاله در ۱۵ صفحه با فرمت PDF قابل دریافت می باشد)
محتوای کامل این مقاله با فرمت WORD هم قابل دریافت می باشد.

راهنمای دانلود فایل کامل این مقاله

اگر در مجموعه سیویلیکا عضو نیستید، به راحتی می توانید از طریق فرم روبرو اصل این مقاله را خریداری نمایید.
با عضویت در سیویلیکا می توانید اصل مقالات را با حداقل ۳۳ درصد تخفیف (دو سوم قیمت خرید تک مقاله) دریافت نمایید. برای عضویت در سیویلیکا به صفحه ثبت نام مراجعه نمایید. در صورتی که دارای نام کاربری در مجموعه سیویلیکا هستید، ابتدا از قسمت بالای صفحه با نام کاربری خود وارد شده و سپس به این صفحه مراجعه نمایید.
لطفا قبل از اقدام به خرید اینترنتی این مقاله، ابتدا تعداد صفحات مقاله را در بالای این صفحه کنترل نمایید.
برای راهنمایی کاملتر راهنمای سایت را مطالعه کنید.

خرید و دانلود فایل PDF یا WORD مقاله

با استفاده از پرداخت اینترنتی بسیار سریع و ساده می توانید اصل این مقاله را که دارای ۱۵ صفحه است به صورت فایل PDF و یا WORD در اختیار داشته باشید.
آدرس ایمیل خود را در کادر زیر وارد نمایید:

مشخصات نویسندگان مقاله سازه پرداز: واژه بندی و یکسان سازی متون فارسی با رویکرد پیکره - محور

شهره طباطبایی سیفی - پژوهشگر ارشد، گروه صوت و پردازش زبان طبیعی، پژوهشگاه خواجه نصیرالدین طوسی، تهران، ایران
ایمان صراف - پژوهشگر ارشد، پژوهشگاه خواجه نصیرالدین طوسی

چکیده مقاله:

اغلب عملیات پردازش متن احتیاج به مرحله پیش پردازش دارد. دقت عملیات مختلف به دقت این ابزار پیش-پردازش وابستگی زیادی دارد. پیش پردازش ممکن است فقط شامل اصلاح و یکسان سازی نویسه ها باشد و یا اعمال پیچیده تری همچون واژه بندی، اصلاح نیم فاصله ها، ریشه یابی، بن یابی و غلط یابی را انجام دهند. هدف از پژوهش حاضر ارایه یک ابزار یکسان سازی و واژه بندی دقیق تر و جامع تر از ابزارهای موجود و مناسب برای مرحله پیش پردازش ابزار تجزیه گر سازه است. تجزیه گر سازه بر روی درخت بانک سازه آموزش داده شده است. واژه بندی درست و مطابق با شیوه-نامه استفاده شده در درخت بانک سازه تاثیر به سزایی در دقت عملیات تجزیه خواهد داشت. سازه پرداز ابزار ارایه شده در این مقاله است که برخلاف روش های رایج که مبتنی بر قانون و لغت نامه هستند از روش های پیکره محور برای این منظور استفاده می کند. عملیات اصلاح نیم فاصله ها، اصلاح صفت های مفعولی افعال مرکب و جداسازی واژه بست ها در ابزار ارایه-شده وجود دارد. ارزیابی ابزار پیش پردازش حاضر بر روی مجموعه 100 جمله نمونه، معیار F معادل 90.4% را نشان می دهد..

کلیدواژه‌ها:

پردازش زبان طبیعی، پیش پردازش، پیکره زبانی، یادگیری ماشین

کد مقاله/لینک ثابت به این مقاله

برای لینک دهی به این مقاله، می توانید از لینک زیر استفاده نمایید. این لینک همیشه ثابت است و به عنوان سند ثبت مقاله در مرجع سیویلیکا مورد استفاده قرار میگیرد:
https://www.civilica.com/Paper-CITCOMP02-CITCOMP02_259.html
کد COI مقاله: CITCOMP02_259

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:
طباطبایی سیفی, شهره و ایمان صراف، ۱۳۹۶، سازه پرداز: واژه بندی و یکسان سازی متون فارسی با رویکرد پیکره - محور، دومین کنفرانس بین المللی پژوهش های دانش بنیان در مهندسی کامپیوتر و فناوری اطلاعات، تهران، دانشگاه مجلسی، https://www.civilica.com/Paper-CITCOMP02-CITCOMP02_259.html

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (طباطبایی سیفی, شهره و ایمان صراف، ۱۳۹۶)
برای بار دوم به بعد: (طباطبایی سیفی و صراف، ۱۳۹۶)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

مدیریت اطلاعات پژوهشی

اطلاعات استنادی این مقاله را به نرم افزارهای مدیریت اطلاعات علمی و استنادی ارسال نمایید و در تحقیقات خود از آن استفاده نمایید.

مقالات پیشنهادی مرتبط

مقالات مرتبط جدید

شبکه تبلیغات علمی کشور

به اشتراک گذاری این صفحه

اطلاعات بیشتر درباره COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.