تعیین استراتژی های نمونه گیری مناسب برای روشهای مختلف داده کاوی ( Data Mining) در مجتمع صنایع لاستیک یزد

سال انتشار: 1383
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,174

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

RUBBER07_015

تاریخ نمایه سازی: 4 فروردین 1387

چکیده مقاله:

داده کاوی یک فرآیند تحلیلی است که برای کاوش مقادیر زیادی از داده که معمولاَ مربوط به امور تجاری یا بازار میباشد طراحی شده است . داده کاوی در واقع فرآیند استخراج اطلاعات و الگوهایی است که قبلاَ بصورت ناشناخته در مجموعه داده های بزرگ در حوزه وسیعی از علوم مختلف و یا تشکیلات تجاری وجود داشته است . هدف اصلی داده کاوی پیش بینی است . مجموعه های بزرگ داده موانعی بزرگ برای داده کاوی هستند . نمونه گیری به عنوان یک تکینک خوب آماری توانسته است نقش خود را به عنوان حل کننده این مشکل ایفا نماید . هدف از این مقاله بررسی استراتژی های نمونه گیری به منظور یافتن حوزه کاربردی آنها در داده کاوی است . در نهایت مجموعه ای از تکنیک های نمونه گیری شامل استراتژیها، الگوریتم ها و راهنمایی هایی برای کاربران تهیه می شود بطوریکه بتوان به راحتی دریافت که هر یک از روشهای داده کاوی به کدام تکنیک نمونه گیری نیاز دارد . جهت اعتبار بخشیدن به نتایج به دست آمده بانکهای اطلاعاتی ( Databases )موجود در مجتمع صنایع لاستیک یزد مورد مطالعه قرار گرفته والگوریتم مناسب برای استفاده در صنعت لاستیک همراه با تجزیه و تحلیل نتایج بدست امده ارائه میشود.

کلیدواژه ها:

داده کاوی (Data Mining)-نمونه گیری-طبقه بندی(Classification)

نویسندگان

جلیل بهناز

رییس کنترل کیفیت - مجتمع صنایع لاستیک یزد

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • H.chen, Machine Learning for Information Retrieval, 1995 ...
  • U.M.fayyad, etal, Advances in knowledge discovery and data mining, 1999 ...
  • H.chen, Knowledge Management System, 2002 ...
  • Salford Systems, Dan Borchert Systems Adminis trator, San Diego, 2004 ...
  • F. Olken and D. Rotem. Random sampling from databases: A ...
  • C. Harris-Jones and T.L. Haines. Sample size and misclas sification: ...
  • J. Kivinen and H. Mannila. The power of sampling knowledge ...
  • J.S. Vitter. An efficient algorithm for sequential random sampling. Technical ...
  • G.H. John and P.Langley. Static versus dynamic sampling for data ...
  • نمایش کامل مراجع