تشخیص متون محاوره از رسمی با روش های آماری

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 995

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ARGCONF03_016

تاریخ نمایه سازی: 26 مرداد 1397

چکیده مقاله:

با رایج شدن ارتباطات مجازی و رشد استفاده از شبکه های اجتماعی، حجم دادگان متنی محاوره ر شد شدیدی دا شته ا ست به طوری که چشم پوشی از این منابع غنی برای متن کاوی امری محال است. با توجه به این که اکثر ابزار های تحلیل تحلیل و بررسی پردازش زیان طبیعی برای متون رسمی قابل استفاده هستند، پیش از هر پردازشی باید این متون محاوره از رسمی جدا شوند تا به فرم استاندارد رسمی خود تبدیل شوند. در این مقاله مدلی جهت تشخیص متون محاوره از ر سمی با ترکیب روش آماری و د ستوری ارایه می شود. از آن جا که دقت روش های آماری محور، به پیکره های مورد استفاده وابسته است، نیاز به دادگان معتبر و گسترده ای وجود دارد. تمام متون و پیکره های مورد ا ستفاده و روش ساخت آن ها در این مقاله تو صیف شده و الگوریتمی برای تشخیص متون محاوره از رسمی ارایه شده است. دقت F به دست آماده الگوریتم با استفاده از پیکره های توصیفی 05,96 است.

نویسندگان

محمد محسن خازنی

کارشناس مهندسی کامپیوتر، دانشگاه علم و صنعت ایران

عین الله خنجری

دانشیار، دانشگاه علم و صنعت ایران

احمد اکبری

کارشناس ارشد هوش مصنوعی، آزمایشگاه پردازش متن شرکت آرمان رایان شریف