یک رویکرد مفهومی- زبانی برای بازیابی اطلاعات دو زبانه

سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,027

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI13_066

تاریخ نمایه سازی: 25 آبان 1386

چکیده مقاله:

در این مقاله یک رویکرد ترکیبی به منظور بازیابی مفهوم ی اسناد در دو زبان فارسی و انگلیسی برای پرس و جوهای مطرح شده به زبان فارسی ارائه میشود. مزیت عمده این رویکرد، ترکیب ویژگیها ی زبانی، مفهومی و آماری اسناد و پرس و جوها میباشد. در این رویکرد ترکیبی، برای استخراج مفاه یم از اسناد و پرس و جوها، از هستان شناسیهای دو زبانه وزن دار و برای یکسان ساز ی زبان ها ی مبدا و مقصد، از عملیات ترجمه پرس و جو توسط ی ک دیکشنر ی دو زبانه استفاده میشود. ترجمه پرس و جو با استفاده از دیکشنر ی، ی ک امر متداول در سیستمهای بازیابی اطلاعات چندزبانه میباشد. اما چون یک کلمه ممکن است با چندین کلمه در دیکشنری معادل باشد با مسئله ابهام در ترجمه مواجه میشویم. بعلاوه، ترجمه کلمه به کلمه پرس و جو نمیتواند دارای دقت کافی باشد. به همین منظور ما چند ین روش مختلف را برای بهبود ترجمه مبتنی بر د یکشنر ی و کاهش ابهام در ترجمه بکار میگیریم که عبارتند از: تشخیص عبارات و ترجمه آنها با استفاده از الگوی ترجمه عبارات، گسترش پرس و جو در قبل و بعد از ترجمه و انتخاب بهترین ترجمههای ممکن. سرانجام رتبه هر سند با استفاده از مدل زبانی آماری با چندین مرحله تبدیل محاسبه میشود و اسناد مرتبط بازیابی میشوند. نتایج نشان میدهند که با استفاده از این رویکرد ترکیبی، کارایی سیستم بازیابی اطلاعات دو زبانه افزایش می یابد.

کلیدواژه ها:

بازیابی اطلاعات دو زبانه ، ابهام زدایی در ترجمه ، رتبهبندی اسناد ، هستان شناسی ، حاشیه نویسی ، مدل زبانی آماری

نویسندگان

سولماز پورمحمود

کارشناس ارشد دانشگاه آزاد اسلامی واحد خوی

مهرنوش شمس فرد

استادیار دانشگاه شهید بهشتی

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • س. مطیعی، آ. نعمت زاده، رتبه‌بندی اسناد براساس میزان ارتباط ...
  • Levow, G. A., Oard, D. W., Resnik, P. Dic tionary-based ...
  • Aljlayl, M. and Frieder, O. Effective Arabic-Engli sh Cross- Language ...
  • Davis, M.W. New Experiments in C ross-Language Text Retrieval. The ...
  • Adriani, M. Using Statistical Term Similarity for Sense D isambiguation ...
  • Kraaij, W., Pohlmann, R. and Hiemstra, D. Twenty-One at TREC-8: ...
  • Myung-Gil Jang, S. H. M. and Park, S. Y. Using ...
  • Federico, M. and Bertoldi, N. Statistical Cros s-Language Information Retrieval ...
  • Ballesteros, L. and Croft, W.B. Phrasal Translation and Query Expansion ...
  • Gao, J., Nie, J. Y. , Xun, E., Zhang, J., ...
  • Adriani, M. and Van Rijsbergen, C.j. Term Similarity- Based Query ...
  • on Research and Advanced Technology for Digital Libraries (ECDL'99). Paris, ...
  • Littman, M. L., Dumais, S. and Landauer, T. K. Automatic ...
  • Yamabana, K., Muraki, K., Doi, S. and Kamei, S. A ...
  • Motiee, S., Nematzadeh, A and Shamsfard, M. ORank: An Ontology ...
  • Van Rijsbergen, C.J. Information Retrieval. 2nd edition, B utterworths, London, ...
  • Rocha, C., Schwabe, D. and Poggi de Aragao, M. A ...
  • Sheykh Esmaili, K., Abolhassani, H., Neshati, M. and Bagheri Hariri, ...
  • Hiemstra, D. Using Language Models for Information Retrieval. Ph.D. thesis, ...
  • Berger, A. and Lafferty, J. Information Retrieval as Statistical Translation. ...
  • protege, _ . 1 Corpus Based Approaches _ Latent Semantic ...
  • نمایش کامل مراجع