اثربخشی ترجمه ماشینی در فرآیند پردازش زبان؛ بهره گیری از قرینه سیاق در معنایابی واژگان قرآن

سال انتشار: 1402
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 126

فایل این مقاله در 30 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_IERF-6-2_005

تاریخ نمایه سازی: 27 خرداد 1402

چکیده مقاله:

به فرآیند برگرداندن مطلبی از زبان مبدا به زبان مقصد که با یافتن هم ارزهای معناشناختی میان دو زبان صورت می­گیرد، ترجمه می­گویند. مهم­ترین مشکلات ترجمه، ابهاماتی است که در واژگان و ساختار جملات وجود دارند. در یک تقسیم­بندی، پنج نوع مهم ابهام واژگانی (ابهام­های مقوله­ای، واژه­های هم­آوا، واژه­های هم­نویسه، چند معنایی و ابهام انتقالی) و دو نوع مهم ابهام ساختاری (ابهام­های ساختاری واقعی و ابهام­های سیستمی) وجود دارد. ترجمه ماشینی (Machine translation: MT) که بخشی از حوزه پردازش زبان طبیعی(Natural Language Processing: NLP) مبتنی بر کامپیوتر در زبان­شناسی رایانه­ای و هوش مصنوعی بوده به عنوان یکی از تکنیک های خودکاری است که متن بدون ساختار را به داده های ساختاری تبدیل می کند با تبدیل متن به اطلاعات، توانسته است تحلیل های بیشتری را به داده ها اعمال کرده تا اطلاعات مفیدی استخراج شود. در این نوشتار که به روش کتابخانه­ای تدوین شده، جهت رفع مسائل پیرامون معنای واژگان در ترجمه ماشینی قرآن، طرحی به صورت نظری پیشنهاد شده که هدف آن کمک به فهم بهتر معنای واژگان قرآن، با بهرمندی از قرینه سیاق و بافت عبارت است. در روش پیشنهادی با بهره­مندی از قاعده سیاق و تکنیک­های متن کاوی، و با استناد به آن، واژه معادل مناسب­تری در زبان مقصد برگزیند. در این طرح، سیاق را در مقیاس کلمات دانسته که می­توان آن را به شرط احراز شرایط به انواع دیگر توسعه داد. به طور خلاصه این طرح دو مرحله دارد: اولویت­بندی (وزن­دهی) واژگان هم­جوار هم ورودی (هر واژه در محدوده آیاتی که در مورد نزول یک­باره آن­ها اتفاق نظر وجود دارد) و سپس مقایسه با کلماتی که اشتراک لفظی (چندمعنا) دارند و  نیز مقایسه هم نظیران یک واژه با هم نظیران سایر واژگان (مترادف­یابی). می باشد.  برای دقیق­تر شدن نتایج می­توان مشخصات بیشتری از کلمات را به صورت دستی تهیه نمود، جداولی شامل مواردی چون مکی یا مدنی بود آیات، ترتیب نزول سوره، مفاهیم و تعابیری که در معنای کلمات قرآن در فرهنگ لغاتی چون لسان العرب ابن منظور و فرهنگ لغت راغب اصفهانی آمده است و غیره. برای بدست آوردن داده­های ورودی از تکنیک­های نمایه­سازی استفاده می­شود. در مرحله پیش پردازش باید داده­هایی که دارای اهمیت کمتری است(Stop Words) (مانند"الذی"، "التی"، "لم"،"کان"،" کانما" و غیره) حذف شود تا خروجی بهتری بدست آید. برای تغییر شکل داده می­توان اعراب را حذف کرد تا کدنویسی راحت­تر انجام شود، برای کاهش نمونه نیز می­توان از ریشه میانوندی کلمات استفاده نمود. برای اینکه با استناد به قاعده سیاق،  برای یکایک کلماتی که به عنوان ورودی مورد پردازش قرار می­گیرند، رکوردی از مشخصات تهیه نمود، لازم است ابتدا واحد سازی(Tokenizer) صورت گیرد، در داده­های اولیه تهیه شده، در کل مجموعه آیات ورودی، بر اساس دو معیار قرابت مکانی و فراوانی تکرار، به هر کلمه وزنی اختصاص یابد. هر چه کلمات به کلمه مورد نظر نزدیک­تر و یا بیشترتکرار شده باشد، وزن بیشتری به آن اختصاص داده می شود که معرف ارتباط معنایی قوی­تر آنان است و  برعکس. طبیعتا  کلماتی که در یک آیه قرار دارند (شماره آیه یکسانی دارند) نسب به کلماتی که در آیات دیگر و فاصله دورتر قرار دارند از ظریب تاثیر بیشتری برخوردار هستند. در سنجش معیار فراوانی: برای نشان دادن اهمیت کلمه در سوره از فراوانی وزنی (TF/IDF Weight) استفاده می­شود، مقدار TF/IDF  به تناسب تعداد تکرار کلمه در هر سوره یا مجموعه آیات ورودی، افزایش می یابد و توسط تعداد آیاتی که در سوره هستند و شامل کلمه نیز می باشند متعادل می شود. در نهایت این نتیجه حاصل آمد که از هم­جواری کلمات و روابط معنایی بین آن­ها و با کمک تکنیک­های متن کاوی، فهم بیشتری از واژگان حاصل شده که این مهم گزینش مناسب­تر واژه معادل در زبان مقصد را منجر می شود.

نویسندگان

زینب شمس

PhD student of Qur'anic and Hadith Sciences, Faculty of Theology, Kashan University, Iran

سپیده چهره

Master of Artificial Intelligence, Islamic Azad University Science and Research Branch, Iran

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Alshaari, M., Elfitori, K., (۲۰۱۴). "Computable Difference Matrix for Synonyms ...
  • Falahati, M., (۲۰۰۶). "Ambiguity in machine translation", Library and Information ...
  • Izadi, M., & Zandieh, N. (۲۰۱۲). "Context and Spontaneous Occurrence ...
  • Lyons, J. (۱۹۷۰). Semantics, ۲th edition. Cambridge: Cambridge University PressNaseh, ...
  • Paktchi, A., (۲۰۱۲). Translation of the Holy Quran; A theoretical ...
  • Rajabi, M., (۱۹۶۷). The method of interpretation of the Qur'an. ...
  • Rezaei Esfahani, M. A., (۲۰۱۱). The logic of Quran translation, ...
  • Saeed, J. I. (۲۰۰۳). Semantics, Malden (MA)/Oxford: Blackwell ...
  • Soyuti, A., (۲۰۰۰). Al-Itqan fi Ulum al-Qur'an, ۲th edition, Beirut: ...
  • Tadin, M. A., (۲۰۱۱). Studying the current problems of solving ...
  • نمایش کامل مراجع