تولید متن فارسی بر اساس کلمات کلیدی با استفاده از مدلهای احتمالاتی و یادگیری عمیق

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 60

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

BECE01_056

تاریخ نمایه سازی: 8 بهمن 1402

چکیده مقاله:

تولید زبان طبیعی از پردازش زبان طبیعی حاصل می شود. زبان طبیعی از یک سیستم ارائه ی ماشینی مانند پایگاه دانش تولید می شود. سیستم های زبان طبیعی از مدتها پیش وجود داشته اما تکنولوژی آن به صورت ابزار تجاری اخیرا به صورت گسترده به وجود آمده است . در این مقاله ما ، با استفاده از روش های هوش مصنوعی در زبان فارسی با ساختار درست و آغاز ی برای تولید متن فارسی می پردازیم ودر جهت پیشبرد تولید متن سع ی شده است از ترکیب روشهای یادگیری ماشین و یادگیری عمیق با مدل های احتمالاتی ، استفاده گردد. در مدل پیشنهادی از مدلهای احتمالاتی برای استخراج قوانین و از شبکه ی عصبی و شبکه های یادگیری عمیق برای بردارسازی متن استفاده شده است . نتایج بهترین مدل که از مدل یادگیری عمیق پیش آموزش دیدهی Elmo استفاده می کند بیانگر این است که این روش نسبت به سایر روشها متون پایدارتر، مفهومی تر و با ساختار بهتر تولید می کنند. مدل Elmo یک مدل یادگیری عمیق با استفاده از شبکه های LSTM و CNN بوده که بر اساس بافتارهای مختلف آموزش دیده و برای یک کلمه در زمینه و با رفتارهای مختلف ، بردارهای تعبیه مختلف ارائه می دهد. به همین دلیل مدل پیشنهادی از سایر مدلها عملکرد بهتری را دارد.

نویسندگان

مجید پوردولت

دانشگاه غیردولتی اشراق بجنورد

احسان جعفری

دانشگاه غیردولتی اشراق بجنورد

شادی لنگری

دانشگاه غیردولتی اشراق بجنورد