CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

شناسایی اخبار بهروز سیاسی با وزن دهیTFIDFبهبودیافته نسبت به زمان

عنوان مقاله: شناسایی اخبار بهروز سیاسی با وزن دهیTFIDFبهبودیافته نسبت به زمان
شناسه ملی مقاله: NCECN01_178
منتشر شده در اولین همایش ملی مهندسی برق و کامپیوتر در شمال کشور در سال 1393
مشخصات نویسندگان مقاله:

مرضیه سپهر - دانشجوی کارشناسی ارشد مهندسی کامپیوتر، دانشگاه صنعتی مالک اشتر ،تهران
مرتضی براری - استادیار مجتمع فناوری اطلاعات و ارتباطات، دانشگاه صنعتی مالک اشتر ،تهران
سمیه کافی - دانشجوی دکتری مهندسی کامپیوتر، دانشگاه صنعتی مالک اشتر ،تهران

خلاصه مقاله:
در اخبار و اطلاعاتی که مدام به روز می شوند، روزانه کلماتی به هر حوزه ی خبری اضافه و یا کم می شود. از این رو، تاریخ انتشار خبر تاثیر زیادی بر کلمات استفاده شده در متن آن دارد. در اغلب روشهای دسته بندی متن اعم از با ناظر و بی ناظر، از کلمات به عنوان بردار ویژگی استفاده می شود. در این روش ها برای وزن دهی به این کلمات اغلب از روش TFIDF استفاده می شود. به طور پیش فرض در روش کلاسیک TFIDF، زمان انتشار متن آموزشی در نظر گرفته نشده است. روش پیشنهادی این مقاله با در نظر گرفتن زمان انتشار متن آموزشی موجب بهبود شناسایی اخبار به روز سیاسی نسبت به روش TFIDF کلاسیک شده است.

کلمات کلیدی:
TFIDF، وزن دهی به کلمات، وزن دهی متناسب با زمان، دسته بندی متن، شناسایی اخبار سیاسی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/330433/