ارائه پیکره متنی موازی فارسی- انگلیسی با کاوش در ویکیپدیا

سال انتشار: 1388
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,861

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSICC15_008

تاریخ نمایه سازی: 26 مهر 1388

چکیده مقاله:

پیکره های متنی موازی و تراز شده یکی از منابع مهم برای بسیاری از تحقیقات زبان شناسی در حوزه چندزبانی مخصوصا ترجمه ماشینی مبتنی بر پیکره های متنی است در این مقاله یک پیکره متنی موازی و تراز شده برای جفت زبان فارسی انگلیسی با کاوش در محتویات ویکی پدیا ارائه می شود. ما روشی برای ترازبندی در سطح جمله ارائه می کنیم که از یک روش بهبود یافته لغتنامه دوزبانه مبتنی برابر پیوند استفاده می کند. نتایج نشان میدهند که دقت این روش نسبت به متد، مشابه دو برابر افزایش داشته است . در حالیکه تعداد کل جفت جملات کاندید تولید شده به نصف کاهش یافته است.

نویسندگان

مهدی محمدی

گروه مهندسی کامپیوتر ، دانشکده فنی دانشگاه شیخ بهایی اصفهان

ناصر قاسم آقایی

گروه مهندسی کامپیوتر دانشکده فنی دانشگاه اصفهان

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Resnik P. and Smith N. A., "The Web as a ...
  • _ _ _ _ Workshop on New Text-Wikis and Blogs ...
  • Wu D., "Aligning _ parallel E nglish-Chinese corpus [3] Yasuda ...
  • pairs from Wikipedia, " in Proceedings of the 6th International ...
  • Brown P., Lai .J. and Mercer . "Aligning Sentences in ...
  • _ _ _ 32nd _ Ma X., Liberman M. Y., ...
  • search over the Web, " in Machine translation sumnit VII, ...
  • (2009, Oct.) Persian Wikipedia. [Online]. HYPERLINK "http :/fa.wikipedia. org/" _ ...
  • نمایش کامل مراجع