تولید خودکار عنوان متون با استفاده از ویژگی های مستقل از زبان
محل انتشار: همایش مهندسی کامپیوتر و توسعه پایدار با محوریت شبکه های کامپیوتری، مدلسازی و امنیت سیستم ها
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 721
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CESD01_177
تاریخ نمایه سازی: 25 اسفند 1392
چکیده مقاله:
با توجه به رشد سریع وب، لزوم استفاده از روش های خلاصه سازی خودکار متن بیش از پیش احساس می شود. با خلاصه سازی اسناد، می توان باسرعت بیشتری به مهم ترین اطلاعات مطروحه در اسناد دست یافت. اما این امر حتی در صورت مطالعه خلاصه اسناد، نیازمند زما قابل توجهی خواهدبود. تولید خودکار عنوان متن که بیانگر ایده اصلی موجود در آ باشد، می تواند سرعت دست یابی به مهم ترین مفاهیم مطرح شده را بهبود بخشد. اما باتوجه به گسترش زبان های مختلف در اینترنت، نیاز به وجود روش های تولید خودکار عنوان متون ، که بدون گرایش به زبان خاصی قادر به تولید عنواناسناد در زبا های مختلف باشند، احساس می شود. در این راستا طراحی سیستم های تولید خودکار عنوا مستقل از زبا (چند زبانه)، که بدون نیاز به دانش ویژه هر زبان ، قادر به تولید عنوان در زبان های مختلف باشند،لازم به نظر می رسد. بدین جهت، سیستم طراحی شده در این پژوهش، در راساتای تولید خودکار عنوان مستقل از زبان اسناد مورد پردازش، فارغ از زبان ورودی قادر به تولید عنوان متون فارسی و انگلیسی است. برای این منظور پس از شناسایی مهم ترین مفاهیم مطرح شده در اسناد مورد پردازش با استفاده از روش های آماری و همچنین مجموعه ای از ویژگی های مستقل از زبان جملات، مهم ترین بخش متن استخراج می شود. نتایج حاصل از این روش حاکی از موفقیت رویکرد اتخاذ شده در مقایسه با برای روش های ارایه شده، برای تولید عنوان است.
کلیدواژه ها:
تولید خودکار عنوان مستقل از زبان (چند زبانه) ، ویژگی های مستقل از زبان جملات
نویسندگان
فرشته خوشنام
گروه کامپیوتر، دانشگاه آزاد اسلامی واحد زنجان، زنجان، ایران
محمدرضا فیضی درخشی
دانشگاه تبریز، تبریز، ایران
مهدی افضلی
گروه کامپیوتر، دانشگاه آزاد اسلامی واحد زنجان، زنجان، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :