CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

دسته بندی متون فارسی بااستفاده ازترکیب خبره ها وبهره گیری ازروشهای GA,LDA,PCA جهت کاهش ویژگی

عنوان مقاله: دسته بندی متون فارسی بااستفاده ازترکیب خبره ها وبهره گیری ازروشهای GA,LDA,PCA جهت کاهش ویژگی
شناسه ملی مقاله: ICS12_050
منتشر شده در دوازدهمین کنفرانس ملی سیستم های هوشمند ایران در سال 1392
مشخصات نویسندگان مقاله:

مهدی برفامی - گروه مهندسی کامپیوتردانشگاه آزاد اسلامی واحد بابل
سهیل فاطری - گروه مهندسی کامپیوتردانشگاه آزاد اسلامی واحد بابل

خلاصه مقاله:
باافزایش حجم اطلاعات نیازبه ابزارهایی که بتواننددرمدیریت منابع موثرباشند کاملا احساس میشود دسته بندی متون فرایندی است که درآن متن ها دریک یاچند دسته ازقبل تعریف شده براساس محتوا قرارمیگیرند دراین مقاله ازترکیب خبره ها بطور خاص شبکه عصبی دردسته بندی مستندات نیمه ساختیافته XML برروی پایگاه داده روزنامه همشهری استفاده شدها ست البته برای دسته بندی مستندات انتخاب ویژگیهای مهم نقش بسزایی دارد لذا تمرکز بررویتکنیک های پیش پردازش و به گونه ویژه روش های وزن دهی ویژگی مورد بررسی قرارگرفته و یکی ازروشها برای وزن دهی به مستندات انتخاب شده است سپس به کمک روش تجزیه و تحلیل مولفه های اصلی به ارزش دهی ویژگیها پرداخته و با الگوریتم نزدیکترین همسایگی تعدادی ازآنها انتخاب و به عنوان ورودی یکی ازخبره ها استفاده میشود درمرحله بعدازویژگیهای ارزش دهی شده یک باربه کمک الگوریتم جداکننده خطی و باردیگر به کمک الگوریتم ژنتیک تعدادی ویژگی انتخاب وبطور مجزا به عنوان ورودی به خبره ها اعمال میشود سپس نتایج خروجی این سه خبره بایکدیگرترکیب شده درنهایت موردتست وارزیابی قرارمیگیرد نتایج بدست امده نشان میدهد دسته بندی متون بادقت بالایی انجام گرفته است

کلمات کلیدی:
استخراج ویژگی ، دسته بندی متون ، شبکه عصبی چندلایه پرسپترون ، مستندات نیمه ساختیافته ، وزن دهی ویژگی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/276130/