همترازی متون با استفاده از روش ترکیبی مبتنی بر ساختار و معنا در کار تشخیص سرقت علمی-ادبی

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 578

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ISCC12_009

تاریخ نمایه سازی: 5 آبان 1397

چکیده مقاله:

تشخیص سرقت علمی- ادبی به فرآیندی گفته می شود که در آن به دنبال کشف منابع برای اسناد مشکوک به سرقت یا همان وظیفهبازیابی منبع که می تواند منابع گسترده وب باشد و همچنین یافتن عبارات سرقتی در متن مشکوک به سرقت و متن منبع بالقوه اشکه وظیفه همترازی متون نامیده می شود، هستیم. کار این مقاله در راستای وظیفه همترازی متون انجام شده است، یعنی به دنبال اینهستیم که پس از یافتن زیر مجموعه ای از منابع که احتمالا منبع سرقت سند مشکوک بوده اند، قسمت های سرقت شده را به صورتجزیی بازیابی کنیم.در روش پیشنهادی ما از دو روش تشخیص ساختاری و معنایی برای کشف عبارات سرقتی در متن استفاده شده است ، به اینمنظور ابتدا با توجه به شباهت ظاهری جملات مشکوک در مقابل عبارات منبع تعیین میکنیم که از کدام روش تشخیصی باید برای هرجمله و پاراگراف معادلش استفاده شود و سپس برای مقایسه ساختاری از استخراج ویژگی های مشترک استفاده می کنیم و برایمقایسه معنایی با استفاده از پایگاه دانش وردنت، مقدار شباهت معنایی جملات تحت حالتی مابین خوش بینانه و سخت گیرانهمحاسبه می شود، ارزیابی کارایی روش پیشنهادی ما روی مجموعه داده های رقابت جهانی پن که در زمینه سرقت علمی- ادبی استبررسی شده است و در نهایت خروجی کار ما بخش های سرقت شده از سند مشکوک و بخش های منبع متناظر آن با پوشش قابلقبولی از سطح سرقت مستقیم تا مبهم خواهد بود.

نویسندگان

مهرنوش خاموشی

دانشجوی کارشناسی ارشد، دانشکده برق-رایانه و فناوری اطلاعات، گروه مهندسی کامپیوتر-نرم افزار، دانشگاه آزاد اسلامی واحد قزوین، قزوین، ایران

محمد صنیعی آباده

استادیار ، دانشکده مهندسی برق و کامپیوتر ،دانشگاه تربیت مدرس ، تهران ، ایران