تولید خودکار عنوان متون با استفاده از ویژگی های مستقل از زبان

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 721

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CESD01_177

تاریخ نمایه سازی: 25 اسفند 1392

چکیده مقاله:

با توجه به رشد سریع وب، لزوم استفاده از روش های خلاصه سازی خودکار متن بیش از پیش احساس می شود. با خلاصه سازی اسناد، می توان باسرعت بیشتری به مهم ترین اطلاعات مطروحه در اسناد دست یافت. اما این امر حتی در صورت مطالعه خلاصه اسناد، نیازمند زما قابل توجهی خواهدبود. تولید خودکار عنوان متن که بیانگر ایده اصلی موجود در آ باشد، می تواند سرعت دست یابی به مهم ترین مفاهیم مطرح شده را بهبود بخشد. اما باتوجه به گسترش زبان های مختلف در اینترنت، نیاز به وجود روش های تولید خودکار عنوان متون ، که بدون گرایش به زبان خاصی قادر به تولید عنواناسناد در زبا های مختلف باشند، احساس می شود. در این راستا طراحی سیستم های تولید خودکار عنوا مستقل از زبا (چند زبانه)، که بدون نیاز به دانش ویژه هر زبان ، قادر به تولید عنوان در زبان های مختلف باشند،لازم به نظر می رسد. بدین جهت، سیستم طراحی شده در این پژوهش، در راساتای تولید خودکار عنوان مستقل از زبان اسناد مورد پردازش، فارغ از زبان ورودی قادر به تولید عنوان متون فارسی و انگلیسی است. برای این منظور پس از شناسایی مهم ترین مفاهیم مطرح شده در اسناد مورد پردازش با استفاده از روش های آماری و همچنین مجموعه ای از ویژگی های مستقل از زبان جملات، مهم ترین بخش متن استخراج می شود. نتایج حاصل از این روش حاکی از موفقیت رویکرد اتخاذ شده در مقایسه با برای روش های ارایه شده، برای تولید عنوان است.

کلیدواژه ها:

تولید خودکار عنوان مستقل از زبان (چند زبانه) ، ویژگی های مستقل از زبان جملات

نویسندگان

فرشته خوشنام

گروه کامپیوتر، دانشگاه آزاد اسلامی واحد زنجان، زنجان، ایران

محمدرضا فیضی درخشی

دانشگاه تبریز، تبریز، ایران

مهدی افضلی

گروه کامپیوتر، دانشگاه آزاد اسلامی واحد زنجان، زنجان، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Bharati, A., Chaitinya, V., Sangal, R., "Natural Language Processing A ...
  • Song, Sh., Li, Ch., "Improved ROCK for Text Clustering Using ...
  • Basajic, R., Krupic, D., Suzic, B., ":Automatic Text Summarization , ...
  • Banko, M., Mittal, V., Witbrock, M., "Headline generation based on ...
  • Vishal Gupta, Lehal G, "Features Selection and Weight learning for ...
  • Zechner, K., ":Automatic Text Abstracting by Selecting Relevant Passages"., _ ...
  • Mani, I. (2001). "Automatic summarization _ : John Benjamins Publishing. ...
  • Evans, D. & McKeown, K. (2005). "Identifying similarities and differences ...
  • McKeown, K. & Siddharthan, A, "Improving Multilingual Summarizati _ Using ...
  • Zajic, D., Dorr, B., Schwartz, R., "Headline generation for written ...
  • Zajic, D., Dorr, B., "Bbn/umd at duc2004: Topiary". In Proceedings ...
  • Ahmad, R., Khanum, A., "Document Topic Generation in Text Mining ...
  • Skorokhodko, E .F, , "Adaptive method of automatic abstracting and ...
  • Goldstein, J., Kantrowitz, M., Mittal, V., Carbonell, J., "Summarizing text ...
  • Salton.G., Buckley.C., ":Automatic text structuring and summary". Information Process And ...
  • Sarkar, K., _ andyopadhyay, S., "Generating Headline Summary from a ...
  • Alotaiby, F., Foda, S., Alkharashi, I., "New approaches to automatic ...
  • Khodra, M.L., Widyantoro, D .H., Aziz, E.A., Trilaksono, B .A., ...
  • Dor, B., Zajic, D., Schwartz, R., "Hedge trimmer: a parse-and ...
  • Xu, S., Yang, Sh., Lau, F., "Keyword Extraction and Headline ...
  • Alguliev, R.M., Aliguliyev, R.M., "Effective summarization method of text documents". ...
  • Kyoomarsi, F., Khosravi, H., Eslami, E., Dehkordy, P.K. & Tajoddin, ...
  • Luhn, H.P., "The automatic creation of literature abstracts"., IBM Journal ...
  • Litvak, M. & Last, M., "Graph-based keyword extraction for _ ...
  • Baxendale, P.B., _ Machine-made index for technical literature:an experiment". IBM ...
  • Armulfo Garc i a-Hernandez, R. _ Ledeneva, Y., "Word Sequence ...
  • Witten, I., Paynter, G., Eibe, F., Gutwin, C., Nevill, C, ...
  • Ahmad, A., Dr.Khanum, A., "Document Topic Generation in Text Mining ...
  • Steinberger, J. & Jezek, K., "Evaluation measures for text summarization ...
  • نمایش کامل مراجع