بررسی مقابله ای سه ماشین ترجمه انگلیسی به فارسی براساس مدل BLEU(2001)

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 823

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCRC01_076

تاریخ نمایه سازی: 25 آذر 1395

چکیده مقاله:

در سال های اخیر ترجمه خودکار به عنوان یکی از زیرشاخه های علم پردازش زبان طبیعی در کشورمان مورد توجه بسیاری از پژوهشگران قرار گرفته است که از آن جمله می توان به مترجم های خودکار ترگمان، پارس و غیره اشاره نمود. جهت بومی سازی این فناوری نیاز است که این مترجم های خودکار مورد ارزیابی و مطالعه ی دقیق و پویا قرار بگیرند. شرکت های بزرگی همچون گوگل نیز در این زمینه ( زبان فارسی ) فعالیت داشته اند ولی به علت وجود دلایلی چون پیکره های نامناسب، مشکلات رسم الخطی و دیگر مشکلات زبان فارسی در ارائه ی یک ماشین ترجمه خوب و حتی متوسط در زمینه زبان فارسی ناکام مانده اند. هدف از این پژوهش ارزیابی سه ماشین های ترجمه Google Translate، ترگمان و پارس می باشد. بدین منظور پنجاه جمله به زبان انگلیسی در پنج شاخه علمی زبانشناسی پیکره ای، رایانه، روانشناسی، مهندسی ژنتیک و شیمی به صورت اتفاقی و از کتابهای علمی این شاخه ها انتخاب شده است. معیار ارزیابی در این مقاله تست BLEU می باشد که به عنوان یک روش استاندارد توسط شرکت IBM در سال 2001 ارائه شده است. پس از انجام آزمایش BLEU و اعمال Paired T-Test بر روی نمرات کسب شده توسط هر ماشین ترجمه، به ترتیب Google Translate، ترگمان و پارس در رده های اول تا سوم قرار گرفتند. همانطور که نتایج به صورت کاملاً آماری و کلی نشان می دهد نمرات کسب شده توسط این مترجم های ماشینی راضی کننده نمی باشد و توسعه این ماشین های ترجمه تا رسیدن به حد مطلوب نیازمند تلاش پژوهشگران فعال در این زمینه می باشد.

کلیدواژه ها:

ماشین ترجمه - پردازش زبان طبیعی - BLEU - Google Translate

نویسندگان

امین رحمانی

دانشجوی کارشناسی ارشد زبانشناسی رایانشی، مرکز منطقه ای اطلاع رسانی علوم و فناوری شیراز

مرضیه توکل

دانشجوی کارشناسی ارشد زبانشناسی رایانشی، مرکز منطقه ای اطلاع رسانی علوم و فناوری شیراز

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • I-Hutchins, W.J. (ed.) 2000. Early years in machine translation: memoirs ...
  • White, J., O'Connell, T. and OMara, F. (1994) "The ARPA ...
  • King, M. 1996. Validity and Evaluation of MT Systems. In ...
  • E.H. Hovy . 1999. Toward finely differentiated evaluation metrics for ...
  • 2003, Och, F. J., Minimum Error Rate Training for Statistical ...
  • Hutchins, J. and Somers, H. (1992).An Introduction o Machine Translation. ...
  • White, John (2003). "How to Evaluate Machine Translation". In Somers, ...
  • Hovy, Eduard H., Margaret King and Andrei Popescu-Belis: (2002), , ...
  • Hammon, Olivier. Rapport du projet cesta : Campagne d"evaluation des ...
  • Black, Paul E., ed. (14 August 2008), "Levenshtein distance", Dictic ...
  • K. Papineni, S. Roukos, T. Ward, and W.-J. Zhu(2002), "BLEU: ...
  • 2005, Banerjee, S. and A. Lavie, "METEOR: An Automatc Metric ...
  • Turian, J. P., L. Shen, and I. D. Melamed. 2003. ...
  • 2006, Snover, M., B. Dorr, R. Schwartz, _ Micciulla, and ...
  • Meritxell Gonzalez and Jesus Gimenez and Lluis Marquez. "'A Graphical ...
  • Meritxell Gonzalez and Laura Mascarell and Lluis Marquez. "tSearch: Flexible ...
  • نمایش کامل مراجع