ارائه روشی جهت ریشه یابی کلمات در زبان فارسی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,679

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCCEB01_097

تاریخ نمایه سازی: 18 خرداد 1393

چکیده مقاله:

یکی از پیش‌نیازهای ضروری رسیدن به نرم‌افزارهای پردازش متن، الگوریتم‌های ریشه‌یابی هستند که به بررسی ساخت واژه لغات می‌پردازند. هدف نهایی الگوریتم‌های ریشه‌یابی حذف پیشوندها و پسوندهای کلمه و رسیدن به ریشه لغت است. در روش‌های پیشین مانند ریشه‌یاب جدولی، الگوریتم ریشه‌یاب تشکری و الگوریتم کراوتز برای زبان فارسی یک دیکشنری شامل ریشه لغات وجود دارد و در هر مرحله پس از حذف پیشوند و یا پسوند، رشته باقیمانده در دیکشنری جستجو می‌شود اما در روش ارائه شده در این مقاله نیازی به نگهداری دیکشنری از اسامی جامد نیست و تنها وندهای کلمات به سیستم معرفی می‌گردند. از سوی دیگر در بسیاری از موارد عمل ریشه‌یابی کلمات بدون درنظر گرفتن نوع کلمه انجام می‌شود که منجر به نتایج نادرست می‌شوند. جهت غلبه بر مشکلات مطرح شده، در این مقاله مدلی جهت ریشه‌یابی کلمات در زبان فارسی با درنظر نوع کلمه معرفی خواهد گردید. نتایج حاصل از آزمایشات انجام شده، نشان‌دهنده افزایش درصد درستی در ریشه‌یابی لغات در زبان فارسی با استفاده از روش پیشنهادی در مقایسه با سایر روش‌های ریشه‌یابی می‌باشد.

نویسندگان

دانیا تمدن

دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان،گروه مهندسی کامپیوتر،اهواز

محمدحسین یکتایی

استادیار،دانشگاه آزاد اسلامی واحد آبادان،گروه مهندسی کامپیوتر،اهواز

ماشالله عباسی دزفولی

دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان،گروه مهندسی کامپیوتر،اهواز

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • رضا حسامی‌فرد، غلامرضا قاسم ثانی "طراحی یک الگوریتم ریشه‌یابی برای ...
  • محمود بی‌جن خان "نقش پیکره‌های زبانی در نوشتن دستور زبان: ...
  • مسعود تشکری، محمدرضا میبدی "طراحی ی ریشه‌یاب خودکار برای واژگان ...
  • و نخبگان واحد شوشتر _ اسفند ماه 1392 ...
  • D. Sharma, "Stemming Algorithms: A Comparative Study and their Analysis", ...
  • E. Al-shemmari, "Towords an error-free stemming, " In ...
  • F. Oroumchian and S. Tasharofi and H. Amiri and H. ...
  • F. Raja and H. Amiri and S. Tasharofi.and M. Sarmadi ...
  • H. Amiri and F. Raja and M. Sarmadi and , ...
  • MF. Porter _ algorithm for suffix stripping." Program, 14(3):130-137, 1980. ...
  • R. Krovetz, "Viewing Morphology as an Inference Process, ; in ...
  • نمایش کامل مراجع