بررسی روش های پالایش متنی صفحات وب

محمدرضا فیضی درخشی; شیما رشیدی

بررسی روش های پالایش متنی صفحات وب

محل انتشار: نخستین همایش داخلی مهندسی کامپیوتر برق و فناوری اطلاعات

سال انتشار: 1392

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 669

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/267662

شناسه ملی سند علمی:

COMP01_017

تاریخ نمایه سازی: 25 تیر 1393

چکیده مقاله:

توسعه سریع شبکه جهانی وب، تنوع دیدگاه ها و توانایی ارسال هر نوع اطلاعاتی روی اینترنت، موجب شده است تا دسترسی به محتوای موهن، مضر و غیر قانونی بیش از پیش آسان گردد. برای کنترل محتوای متنی اینترنت شناسایی صفحات وب با محتوای مضر حائز اهمیت است. با طبقه بندی صفحات وب می توان چنین صفحاتی را از صفحات سالم تشخیص داده و از دسترسی آسان به اینگونه مطالب جلوگیری کرد. با توجه به اینکه از واقعیت پالایش مطالب اینترنت گریزی نیست، شناخت و بررسی روش های پالایش متنی به فهم صحیح از پالایش، نقاط قوت و ضعف آن ها کمک شایانی می نماید. به همین دلیل در این مقاله مختصراً به پالایش و روش های آن و برخی روش های رایج طبقه بندی در امر پالایش پرداخته شده است. اگرچه بیان همه روش ها ممکن نیست، اما این مقاله می تواند آگاهی مناسبی از پالایش متنی و روش های آن، برای خواننده فراهم کرده و فرد را به منابع مناسب هدایت کند.

کلیدواژه ها:

پالایش ، طبقه بندی صفحات وب ، فراوانی کلمات ، انطباق کلید واژه ، تشابه اسناد

نویسندگان

محمدرضا فیضی درخشی

استادیار، گروه مهندسی کامپیوتر، دانشگاه تبریز

شیما رشیدی

کارشناسی ارشد، گروه علوم کامپیوترف دانشگاه تبریز

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

پالایش صفحات وب بر اساس تحلیل هوشمند محتوا [مقاله کنفرانسی]
Ahmadi, A., Fotouhi, M., Khaleghi, M., "Intelligent classification of web ...
Qi, X., Davison, B. D., "Web Page Classification Features and ...
Ghosh, Roy, S., B andyopadhyay, S., "A Tutorial Review on ...
Kusrini, Hartati, S., _ Imp lementation of C4.5 Algorithm to ...
Hall Mark, A.. _ Co rre lation-based Feature Selection for ...
_ A., et al, "A Brief Survey of Text Mining ...
K.Nigam, A. McCallum, S. Thrun, T. Mitchell, "Text Classification from ...
Available on. _ :Sscikit-learn _ _ _ _ naive baves ...
Sebastiani, F., "Machine Learning in Automated Text Catego rization, _ ...
Silva, C., Riberio, B., "Studies in computational Intelligence, " Springer, ...
SU, G. Y., LI, J. H., MA, Y.H., and LI, ...
R. Du, R. Safavi-Naini, and W. Susilo, "Web filtering using ...
Lee Pui, Y., Hui Siu, C, and Fong, M., "Neural ...
Guermazi, R., Hammami, M., and Hamadou, _ B., "Using a ...
Guermazi, R., Hammami, _ and Hamadou, A. B., "WebAngels Filter: ...

نمایش کامل مراجع