طبقه بندی پویای مستندات HTML با استفاده از هستان شناسی و واژگان مفهومی
محل انتشار: دهمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1383
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,036
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI10_139
تاریخ نمایه سازی: 25 آذر 1390
چکیده مقاله:
دراینمقاله پس از بررسی اجمالی روشهای موجود برای طبقه بندی مستندات متنی روشی ترکیبی برای تعیین طبقه صفحات HTML معرفی می شود این روش با تلفیق خصوصیات آماری مفهومی و نگارشی صفحات HTML آنها را از نظر موضوعی طبقه بندی می کند الگوریتم اصلی طبقه ندی دراین روش برمبنای الگوریتم آماری Rocchio طراحی شده است و برای افزایش کارایی ویژگیهایی مانند مفهوم کلمات، محل وقوع آنها درسندو شیوه نگارش کلمات مورد توجه قرارگرفته اند. درا ین روش عمل طبقه بندی به دو صورت با نظارت و بی نظارت قابل انجام است و هستان شناسی طبقات موضوعی می تواند در طول حیات سیستم به صورت پویا بهنگام شود.
کلیدواژه ها:
نویسندگان
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :