CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بهبود ترجمه ماشینی آماری انگلیسی–فارسی با استفاده از ویژگی های زبان شناختی

عنوان مقاله: بهبود ترجمه ماشینی آماری انگلیسی–فارسی با استفاده از ویژگی های زبان شناختی
شناسه ملی مقاله: MHCONF03_037
منتشر شده در همایش بین المللی سالانه افق های نوین در مهندسی برق،کامپیوتر و مکانیک در سال 1397
مشخصات نویسندگان مقاله:

علی الهیار - کارشناس پژوهشی جهاد دانشگاهی،
محمد پورمحمود - هییتعلمی جهاد دانشگاهی،

خلاصه مقاله:
ترجمه ماشینی آماری بهعنوان یکی از بهترین روشها برای ترجمه از یکزبان به زبان دیگر شناخته میشود .برای زبانهایی که ازلحاظ ساختار دارای شباهت زیادی با یکدیگر هستند خروجی این مترجم بسیار مناسب هست. از مشکلات اساسی در رابطه با ترجمه ماشینی آماری وجود نداشتن پیکره دوزبانه بزرگ است که منجر به دستیابی به خروجی هایی باکیفیت نامطلوب شده است. البته تنها با پیکره های دوزبانه نمیتوان تمام ویژگیهای زبانی را به دست آورد و نیاز به عملیات زبانشناسی در ترجمه آماری احساس میشود. در این مقاله ابتدا به بررسی و مقایسه روشهای بازسازی ساختاری که باهدف بهبود بخشیدن به کیفیت سامانه های ترجمه آماری هست، پرداخته شده است. بازسازیهای ساختاری که به صورت داخلی در سامانه های ترجمه آماری انجام میشوند محدود هستند و برای جفت زبانهایی که تفاوتهای ساختاری زیادی باهم دارند به اندازه کافی مناسب نیستند؛ بنابراین نیاز به فن های بیشتری در این زمینه احساس میشود. بر اساس آزمایشهای انجام شده برای بررسی کیفیت خروجی سیستم ترجمه حاصل با استفاده از سیستمهای ارزیابی موجود، بهبود قابل قبولی نسبت به سیستم ترجمه ماشینی پایه به دست آمده است. روش انجام گرفته در این مقاله منجر به بهبود در حدود 1/11 درصدی را در معیار ارزیابی بلو مشاهده شده است.

کلمات کلیدی:
ترجمه ماشین آماری، بازسازی ساختاری، پردازش زبان طبیعی، زبان شناسی رایانشی.

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/845798/