بررسی روش های پالایش متنی صفحات وب
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 669
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
COMP01_017
تاریخ نمایه سازی: 25 تیر 1393
چکیده مقاله:
توسعه سریع شبکه جهانی وب، تنوع دیدگاه ها و توانایی ارسال هر نوع اطلاعاتی روی اینترنت، موجب شده است تا دسترسی به محتوای موهن، مضر و غیر قانونی بیش از پیش آسان گردد. برای کنترل محتوای متنی اینترنت شناسایی صفحات وب با محتوای مضر حائز اهمیت است. با طبقه بندی صفحات وب می توان چنین صفحاتی را از صفحات سالم تشخیص داده و از دسترسی آسان به اینگونه مطالب جلوگیری کرد. با توجه به اینکه از واقعیت پالایش مطالب اینترنت گریزی نیست، شناخت و بررسی روش های پالایش متنی به فهم صحیح از پالایش، نقاط قوت و ضعف آن ها کمک شایانی می نماید. به همین دلیل در این مقاله مختصراً به پالایش و روش های آن و برخی روش های رایج طبقه بندی در امر پالایش پرداخته شده است. اگرچه بیان همه روش ها ممکن نیست، اما این مقاله می تواند آگاهی مناسبی از پالایش متنی و روش های آن، برای خواننده فراهم کرده و فرد را به منابع مناسب هدایت کند.
کلیدواژه ها:
نویسندگان
محمدرضا فیضی درخشی
استادیار، گروه مهندسی کامپیوتر، دانشگاه تبریز
شیما رشیدی
کارشناسی ارشد، گروه علوم کامپیوترف دانشگاه تبریز
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :