CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارایهی روش بانظارت به منظور دستهبندی مقالات با وجود ابهام درداد هها

عنوان مقاله: ارایهی روش بانظارت به منظور دستهبندی مقالات با وجود ابهام درداد هها
شناسه ملی مقاله: ICS12_046
منتشر شده در دوازدهمین کنفرانس ملی سیستم های هوشمند ایران در سال 1392
مشخصات نویسندگان مقاله:

نصیرالدین مزروعی سبدانی - دانشکده ی مهندسی برق و کامپیوتر، بخش مهندسی کامپیوتر، دانشگاه کاشان، کاشان
حسین ابراهیم پورکومله - دانشکده ی مهندسی برق و کامپیوتر، بخش مهندسی کامپیوتر، دانشگاه کاشان، کاشان
علی محمد نیک فرجام - دانشکده ی مهندسی برق و کامپیوتر، بخش مهندسی کامپیوتر، دانشگاه کاشان، کاشان

خلاصه مقاله:
در دنیای مقالات با توجه به استفاده از نام های مختصر یا وجود غل طهای املایی، هر نویسنده ممکن است نام های متعددی داشته باشد یا نویسندگان مختلف، نام های یکسانی را به کاربرند. علاوه بر نام نویسنده، سایر فیلدهای اطلاعاتی مربوط به یک مقاله اعم ازکلمات کلیدی، ژورنال یا کنفرانس مربوطه و سال نشر نیز می تواند دارای ابهام یا فاقد اطلاعات باشد. این موارد باعث کاهش کاراییسیست مهای اطلاعاتی مانند بازیابی اسناد 1 و موتورهای جست وجو میشود. در این مقاله روشی بانظارت در جهت دسته بندی مقالات با وجود ابهام در داده ها ارایه م یگردد. روش ارایه شده دارای دو مرحله یاصلی است: پیش پردازش و دسته بندی. از آن جا که ارزیابی این روش به وسیل هی مجموعه داد ههای سرویس جست وجوی مقالات علمی شرکت مایکروسافت است و به صورت ماشینی استخراج شده اند؛ نیاز به پیش پردازش برای حذف مواردی که فاقد اطلاعات مفید هستند، احساس م یشود. سپس، در مرحله ی دست هبندی به استخراج ویژگی های کارا و انجام کلاسه بندی اقدام م یگردد

کلمات کلیدی:
بازیابی اطلاعات، یادگیری بانظارت، دسته بندی مقالات، ابهام زدایی نامها، جنگل تصادفی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/276126/