شناسایی جملات هم ترجمه با استفاده از طبقهبند آنتروپی بیشینه

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 523

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICS12_115

تاریخ نمایه سازی: 11 مرداد 1393

چکیده مقاله:

منبع اصلی رویکردهای رایج امروزی در ترجمه ماشینی، متون دوزبانه در انداز ههای بسیار بزرگ است که اصطلاحا پیکره موازی خوانده می شوند. اما اکثر زبان های طبیعی با کمبود پیکره های موازی روبه رو هستند. بنابراین تلاش برای ساخت پیکره های موازیبیش تر همچنان یک ضرورت مهم در حوزه ترجمه ماشینی محسوب می شود. شناسایی جملات هم ترجمه که جملات موازی نیز خوانده می شوند، رکن مشترک در اکثر تلاش ها برای ساخت خودکار پیکره های موازی است. ما در اینجا از طبقه بند آنتروپی بیشینه جهت شناسایی جملات همترجمه استفاده می کنیم. همچنین برای این طبقه بند از ویژگی های عمومی جمله و ویژگی های مبتنی برهمترازی در سطح کلمه بین دو جمله استفاده می کنیم. همترازی در سطح کلمه جملات با استفاده از ابزار متن بازGiza++ انجام می شود. این ویژگی ها به تفکیک شرح داده می شوند و تأثیری که بر نتیجه طبقه بند می گذارند، بررسی می شود. نتایج ارزیابی نشان می دهد که طبقه بند آنتروپی بیشینه طراحی شده می تواند با دقت بالایی جملات را به جملات موازی و جملات غیر موازی طبقه بن دی کند.

کلیدواژه ها:

طبقه بند آنتروپی بیشینه ، پیکره موازی ، همترازی در سطح کلمه ، جفت جمله موازی ، ترجمه ماشینی آماری

نویسندگان

علیمه زاری

دانشجوی کارشناسی ارشد، بخش مهندسی کامپیوتر، دانشگاه شیراز ، شیراز،

محمدهادی صدرالدینی

دانشیار، بخش مهندسی کامپیوتر، دانشگاه شیراز ، شیراز

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Persian Statistical Machine Translation System", In: 16th CSI International Symposium ...
  • Linguistics, Vol. 19, pp. 263-311, 1993. ...
  • Och, F. J., Ney, H., "Improved Statistical Alignment Models", In: ...
  • Koehn, P., "Europarl: A Parallel Corpus for Statistical Machine Translation", ...
  • Resnik, P., Smith, N. A., "The web _ a parallel ...
  • Qasemizadeh, B., Rahimi, S., ...
  • Institute, California, 2007. ...
  • Pilevar, M. T., Pilevar, A. H., Faili, H., "TEP: Tehran ...
  • Farajian, M. A., "Pen: Parallel English-Persian News Corpus", In: Proceedings ...
  • _ _ _ _ S. M., Khadivi, S., "Developing an ...
  • Kaufmann, J. _ "JMaxAlign: A Maximum Entropy Parallel Sentence Alignment ...
  • Munteanu, D., Fraser, A, Marcu, D., "Improved Machine ...
  • Supreme Council of Information and Communication Technology, http ://d ad ...
  • نمایش کامل مراجع