تجزیهی بیمربی کلمات زبان فارسی به واژهای تشکیل دهنده

سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,339

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI13_232

تاریخ نمایه سازی: 25 آبان 1386

چکیده مقاله:

در این مقاله، روشی جدید برای تجزیهی بیمربی کلمات زبان فارسی به واژهای سازنده، پیشنهاد میشود. در تئوری ریختشناسی زبان، به کوچکترین اجزای یک کلمه که هنوز دارای معنی باشند، واژ گفته میشود. در نظر گرفتن واژ به عنوان واحد حاوی اطلاعات، الگوریتمهای پردازش زبان طبیعی را قادر میسازد تا اطلاعات آماری کاملتری از دادههای آموزشی به دست آورند. تاکنون تحقیقات بسیار کمی در زمینه تجزیهی خودکار و بیمربی کلمات زبان فارسی به واژها انجام گرفته و نتایج به دست آمده چندان مطلوب نیست. روش پیشنهادی در این مقاله دارای دو مرحله است. در هرکدام از مراحل روی خاصیت مشخصی از مفهوم واژ تأکید شده است. در مرحلهی اول، تعدادی از زیررشتهها با استفاده از ساختمان دادهی ترای و معیار توان پیشبینی، برای برگزیده شدن به عنوان واژ، کاندید میشوند. در مرحلهی دوم، از بین زیررشتههای کاندید شده با استفاده از ساختمان دادهی گراف جهتدار بدون دور، زیر رشتههایی که میتوان آنها را در تعداد بیشتری کلمه مشاهده کرد، به عنوان واژ انتخاب میشوند. نتایج عملی نشان میدهد که الگوریتم پیشنهادی، معیارهای دقت و پوشش را حدود ۲۰ % نسبت به تنها روش پیشین بکار رفته برای زبان فارسی، بهبود میدهد.

نویسندگان

مسعود فیض بخش

دانشگاه صنعتی شریف

رضا صدرائی

دانشگاه صنعتی شریف

غلامرضا قاسم ثانی

دانشگاه صنعتی شریف

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • _ Goldsmith, J., _ _ U nSupervised learning of the ...
  • Harris, Z., "From phoneme _ morpheme", Language, vol 31, 190-222, ...
  • Harris, Z., "Morpheme boundaries within words: report on a computer ...
  • Hafer, M. A., Weiss, S. F. "Word segmentation by letter ...
  • Deerwester, S., Susan, D., Furnas, G., Landauer, T., Harshmann, R., ...
  • Schone, P., Jurafsky, D., _ _ L anguage- independent induction ...
  • Jacquemin, C., "Guessing morphology from terms and corpora", Proceedings of ...
  • Gaussier, E., _ _ U nSupervised learning of derivational morphology ...
  • Creutz, M., _ U nSupervised _ gmentation of words using ...
  • Brent, M., "Minimal generative models: A middle ground between neurons ...
  • Arabsorkhi, M., Shamsfard, M., _ _ U nSupervised Discovery Of ...
  • نمایش کامل مراجع