تشخیص هویت نویسنده اسناد متنی مبتنی بر یادگیری عمیق

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 851

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEITCONF03_033

تاریخ نمایه سازی: 6 خرداد 1399

چکیده مقاله:

بطور کلی تشخیص نویسنده متون تلاشی برای نشان دادن خصوصیات تولیدکننده یا نویسنده یک تکه از اطلاعات زبانی تعریف میشود،به طوریکه بتوان بین متون مختلف که نوشته افراد مختلف اند، تمایز قائل شویم .شناسایی نویسنده از روی نثر سبک و شیوه نوشتاری، یا به عبارت دیگر ویژگی های نهفته درمتون نوشته شده توسط وی می باشد.ترکیب خصوصیات نوشتاری مانند طول کلمات، چینش پاراگراف ها، پرمایگی واژگان، استفاده از کلمات تابعی و غیره را تشکیل میدهند. از طریق این خصیصه های سبک شناختی، که معمولا در طول نوشتار یک فرد ثابت هستند شناسایی هویت نویسنده متون انجام میگیرد. در ارائه روشهای تشخیص نویسنده متون نکته حائز اهمیت، انتخاب ویژگی های کلیدی و حذف ویژگیهای اضافی و غیرمرتبط در تشخیص نویسنده متون میباشد. لذا از اینرو ما در این مقاله روشی براساس شبکه های عصبی و یادگیری عمیق برای انتخاب ویژگیها در تشخیص نویسنده اسناد متنی ارائه دادیم. با استفاده از مجموعه داده های روییتر، تعداد متون دسته بندی شده درست، نادرست و مقدار معیارهای ارزیابی دقت، در روش پیشنهادی مورد بررسی و ارزیابی قرار گرفته شده است. ارزیابی نتایج ، بازخوانی، صحت بیانگر دقت بالا و نتایج بهینه روش پیشنهادی درمقایسه با سایر روشهای استخراج ویژگی های متون درتشخیص هویت نویسنده اسناد متنی میباشد.

نویسندگان

سینا آهنگری

دانشجوی کارشناسی ارشد فناوری اطلاعات، گروه کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران

کامبیز مجیدزاده

استادیار، گروه کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران

امین بابازاده سنگر

استادیار، گروه کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران