دسته بندی اخبار فارسی حوزه دفاعی با استفاده از هستان شناسی
سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 787
فایل این مقاله در 14 صفحه با فرمت PDF و WORD قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CITCOMP02_331
تاریخ نمایه سازی: 7 اسفند 1396
چکیده مقاله:
امروزه با توسعه وب و رسانه های اجتماعی مختلف، کاربران به سادگی خبرهای موردنظر خود را تولید و به اشتراک می گذارند. این امر موجب تولید حجم انبوهی از اطلاعات ارزشمند در مورد موجودیت های مختلف شده است. اغلب اطلاعات تولیدشده به صورت متون زبان طبیعی نیمه ساختاریافته و غیر ساختاریافته هستند. حجم انبوه داده ها موجب سردرگمی در فضای وب و رسانه های اجتماعی شده و مشکلاتی را در مدیریت و جستجوی اطلاعات مرتبط به وجود آورده است. یکی از راهکارهای کارآمد برای حل این چالش، دسته بندی (رده بندی) متون اخبار برحسب ویژگی های مختلف و ارایه آن در قالب مناسب به کاربران است. تاکنون روش های مختلفی برای دسته بندی متون اخبار ارایه شده ولی اکثر این روش ها بر روی متون زبان انگلیسی تمرکز داشته و تلاش چندانی در حوزه متون فارسی به خصوص اخبار حوزه دفاعی صورت نگرفته است.هدف از این پژوهش، دسته بندی نمودن اخبار فارسی حوزه دفاعی، نه تنها بر اساس واژه های متون اخبار، بلکه استفاده از یک پایگاه دانش خارجی به منظور تعمیم واژه ها به کلمات مرتبط با آن می باشد. برای این منظور از تکنیک های مهندسی هستان شناسی استفاده شده است؛ بنابراین درصورتی که در خبر جدید، چه از واژه ای که در متون آموزشی بوده و چه از واژه های مرتبط با آن استفاده شده باشد، دسته بند این توانایی را خواهد داشت که خبر جدید را به درستی دسته بندی نماید. نتایج بررسی ها نشان می دهد روش پیشنهادی به کارایی 88.4% برحسب معیار دقت دست یافته که نرخ بهبود 10.4% را نسبت به روش استاندارد نشان می دهد.
کلیدواژه ها:
نویسندگان
سیامک هاشمی
گروه مهندسی کامپیوتر گرایش هوش مصنوعی، دانشکده فناوری اطلاعات، ارتباطات و امنیت، دانشگاه صنعتی مالک اشتر، تهران، ایران
مریم حورعلی
استادیار، گروه مهندسی کامپیوتر گرایش هوش مصنوعی، دانشگاه صنعتی مالک اشتر، تهران، ایران