واژه های دستوری به مثابه نشانگرهای گویش فردی: رویکردی پیکره ای به شناسایی هویت نویسنده در زبان فارسی

سال انتشار: 1398
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 220

فایل این مقاله در 25 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_LRR-10-3_013

تاریخ نمایه سازی: 18 مهر 1400

چکیده مقاله:

شناسایی هویت نویسنده یکی از حوزه های تحقیقاتی مهم در حیطه زبان شناسی حقوقی است که موضوع پژوهش های زبان شناختی و رایانشی گسترده در زبان های مختلف بوده است. با این حال شواهد محدودی از پژوهش های صورت گرفته با موضوع شناسایی نویسنده در زبان فارسی وجود دارد. در این پژوهش امکان شناسایی نویسنده یک متن با تکیه بر مفهوم گویش فردی و با استفاده از واژه های دستوری زبان فارسی بررسی شده است. واژه های دستوری از آن جهت که به طور ناخودآگاه در تولید زبان به کار گرفته می شوند، مستقل از موضوع متن به کار می روند و بسامد بالایی در متون کوتاه دارند، می توانند نشانگرهای موثری برای کدگذاری گویش فردی و ممیز سبک نویسندگان باشند. در این پژوهش، ابتدا پیکر ه هایی متنی از نوشته های پنج محقق و نویسنده معاصر جمع آوری و سپس با استفاده از نرم افزار خطایاب وفا، استانداردسازی شدند. با استفاده از بسته سبک سنجی stylo نرم افزار آماری R، واژه های پربسامد دستوری با توالی های یک تا سه نگاشتی از متون استخراج شدند و سپس قابلیت تفکیک متون بر اساس این واژه ها و با استفاده از تحلیل مولفه های اصلی و همچنین تحلیل خوشه ای بر اساس مقیاس فاصله ای دلتا بررسی شد. نتایج نشان داد که واژه های دستوری در زبان فارسی قابلیت تفکیک متون متعلق به یک نویسنده را دارند و عملکرد واژه های تک نگاشتی بهتر از دونگاشتی و سه نگاشتی ها در متون کم حجم است. همچنین نتایج پژوهش نشان داد که حجم کمینه متن برای شناسایی موفقیت آمیز نویسنده در متون فارسی حدود ۴۰۰۰ واژه بر اساس ۲۰ واژه دستوری پربسامد است.    

نویسندگان

رامین گلشائی

Assistant Professor of Linguistics- Al-Zahra University –Tehran –Iran.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • • Argamon, S., & Levitan, S. (۲۰۰۵). “Measuring the usefulness ...
  • • Binongo, J. (۲۰۰۳). “Who wrote the ۱۵th book of ...
  • • Barlow, M. (۲۰۱۰). “Individual usage: a corpus-based study of ...
  • • Barthes, R. (۱۹۷۷). Elements of Semiology. Hill and Wang: ...
  • • Burrows, J. F. (۱۹۸۷). “Word patterns and story shapes: ...
  • • Burrows, J. F. (۲۰۰۲). “Delta: A measure of stylistic ...
  • • Carroll, D. (۲۰۰۸). Psychology of Language (۵rd ed.). Wadsworth ...
  • • Eder, M. (۲۰۱۳). “Does size matter? Authorship attribution, small ...
  • • Eder, M.; M. Kestemont & J. Rybicki, (۲۰۱۳), “Stylometry ...
  • • Faili, H.; N.; Ehsan; M. Montazery & M. M. ...
  • • Farahmandpour, Z. & H. Nikmehr, (۲۰۱۵), “A study on ...
  • • Frontini, F.; G. Lynch & C. Vogel, (۲۰۰۸), “Revisiting ...
  • • Gamon, M. (۲۰۰۴). “Linguistic correlates of style: Authorship classification ...
  • • Hedegaard, S. & J. G. Simonsen, (۲۰۱۱), “Lost in ...
  • • Holmes, D. I.; L.J. Gordon & C. Wilson, (۲۰۰۱), ...
  • • Hubert, L. and Arabie, P. (۱۹۸۵). “Comparing partitions”. Journal ...
  • • Jakobson, R. (۱۹۷۱). Studies on Child Language and Aphasia. ...
  • • Johansson, V. (۲۰۰۸). “Lexical diversity and lexical density in ...
  • • Johnson, A. & D. Wright, (۲۰۱۴), “Identifying idiolect in ...
  • • Kestemont, M. (۲۰۱۴). “Function words in authorship attribution: from ...
  • • Koppel, M. & J. Schler, (۲۰۰۳), “Exploiting stylistic idiosyncrasies ...
  • • Modaber Dabagh, R. (۲۰۰۷). “Authorship attribution and statistical text ...
  • • Mosteller, F. & D.L. Wallace, (۱۹۶۴), Inference and Disputed ...
  • • Rand, W. M. (۱۹۷۱). “Objective criteria for the evaluation ...
  • • R Core Team, (۲۰۱۵), “R: A language and environment ...
  • • Segarra, S.; M. Eisen & A.Ribeiro, (۲۰۱۵), “Authorship attribution ...
  • • Stamatatos, E. (۲۰۰۹). “A survey of modern authorship attribution ...
  • • Stein, B. & S. Meyer zu Eissen, (۲۰۰۷), “Intrinsic ...
  • • Totty, R. N. & J. P Hardcastle, (۱۹۸۷), “Forensic ...
  • • Wardhaugh, R. & J. M. Fuller, (۲۰۱۵), An Introduction ...
  • • Whitelaw, C. & S. Argamon, (۲۰۰۴), “Systemic functional features ...
  • • Whitelaw, C. & J. Patrick, (۲۰۰۴), “Selecting systemic features ...
  • • Zhao, Y. & J. Zobel (۲۰۰۵). “Effective and scalable ...
  • نمایش کامل مراجع