|
جداسازي هرز نامههاي متني يك رويكرد مبتني بر الگوريتم ژنتيك و روش دسته بندي SVM Fulltext
نويسندهگان:
[ سعيد جليلي ] - دانشگاه تربيت مدرس، گروه كامپيوتر آزمايشگاه يادگيري ماشين [ شيما گراني ] - دانشگاه تربيت مدرس، گروه كامپيوتر آزمايشگاه يادگيري ماشين
خلاصه مقاله:
در اين مقاله، يك روش تركيبي الگوريتم ژنتيك براي انتخاب خصيصه و روش دستهبندي svm براي جداسازي نامه هاي هرز پيشنهاد شده است. روش پيشنهادي روي مجموعه نامه هاي استاندارد LingSpam ارزيابي شدهاست . نتايج حاصل از ارزيابي نشان مي دهد كه روش پيشنهادي علاوه بر حفظ و يا بالا بردن معيارهاي دقت، فراخواني وF 1 تعداد خصيصهها را حدوداً به ١%، تعداد اوليه كاهش مي دهد. همچنين، مقايسه نتايج حاصل از ميانگين دقت، فراخواني و F1 دسته بندي هرزنامه ب ا روش روش پيشنهادي با روشهايي كه ازSVM به همراه يك روش فيلتري انتخاب خصيصه استفاده ميكنند و ساير روشهاي آماري جداسازي هرزنامهها نشان ميدهد كه روش پيشنهادي از نظر دقت و فراخواني قابل مقايسه و حتي در مواردي بهتر بوده است.
كلمات كليدي:
هرزنامه، يادگيري ماشين، الگوريتم ژنتيك ، SVM ، انتخاب خصيصه
[ لينک دايمي به اين صفحه: http://www.civilica.com/Paper-ISCC04-ISCC04_017.html ]
|