استخراج گرامر زبان فارسی با استفاده از الگوریتمهای ژنتیک

سال انتشار: 1385
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,135

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI12_306

تاریخ نمایه سازی: 23 دی 1386

چکیده مقاله:

شیوههای محاسباتی ماشینی در پردازش زبان بیشتر منحصر به روش های با مربی است و به دلیل کارایی و جوابهای دلسرد کننده- ای که مکررًا از روشهای بد ون مربی بدست م یآید بر دادههای دستیساز تکیه دارد. این درحالیست که روشهای استنتاج گرامر بدون مربی بسیار مفید هستند، چرا که متون تجزیه شده دستی تنها برای تعداد کمی از زبان ها موجود میباشند. به هرحال با اینکه مسئله یادگیری نحو زبان از میان متون خام، توجه زیادی را درحدود یک دهه به خود اختصاص داده است، نتایج کمی در بر داشته است. در این مقاله، روشی بدون مربی جهت استخراج گرامر زبان فارسی ارائه خواهد ش د. این روش با استفاده از الگوریتم های ژنتیک و بهر هگیری از الگوریتم درون -بیرون جهت تولید جمعیت اولیه، کار م یکند. مزیت الگوریتمهای ژنتیک در این پروژه خروج از بهینههای محلی به کمک عملگر جهش، و مشکل آن حجم بالای محاسبات درصورت استفاده از جمعیت اولیه تصادفی اس ت. از طرف دیگر الگوریتم درو ن-بیرون با اینکه مشکل بهینه محلی دارد می تواند گرامرهای ابتدایی را که بسیار برتر از گرامرهای تصادفی هستند ارائه ده د. نتایج آزمای شهای انجام شده در دو زمینه فارسی و انگلیسی برتری آشکار این روش را نسبت به عموم روش های بدون مربی نشان میدهد.

نویسندگان

محسن عرب سرخی

دانشجوی کارشناسی ارشد کامپیوتر-نرم افزار، دانشگاه شیراز، دانشکده مه

منصور ذرالقدری جهرمی

عضو هیئت علمی دانشگاه، دانشگاه شیراز، دانشکده مهندسی، بخش مهندسی و ع

هشام فیلی

دانشجوی دکترای کامپیوتر-هوش مصنوعی، دانشگاه شریف، دانشکده مهندسی کا