مرور نظام مند کیفیت داده در فرایندکاوی

سال انتشار: 1402
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 66

فایل این مقاله در 57 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_STIM-9-3_012

تاریخ نمایه سازی: 10 بهمن 1402

چکیده مقاله:

هدف: فرایندکاوی ارتباط میان دو زمینه داده کاوی و یادگیری ماشین، با رویکردهای مدیریت فرایند کسب وکار را فراهم می سازد. یک فرایند کسب وکار ترتیبی از فعالیت های مستقل و به هم مرتبط است، که در هنگام انجام هر کدام از فعالیت های پیش بینی شده، از یک یا چند منبع (شامل زمان، افراد، هزینه و ...) برای تبدیل ورودی ها (داده، مواد و ...) به خروجی های مورد نیاز استفاده می کند. با استفاده از روش های فرایندکاوی می توان رفتار حقیقی سازمان ها شامل عملکرد افراد، بخش ها و منابع را بررسی نمود. نتایج حاصل از فرایندکاوی که به صورت معمول شامل مدل های فرایند کسب وکار است را می توان با مستندات و الزامات سازمان ها مقایسه کرد. بدین سان امکان بررسی، نظارت و بهبود فرایندها امکان پذیر خواهد شد. مبنای عمل روش های فرایندکاوی براساس نگاره های رویداد ذخیره شده در سامانه های اطلاعاتی است. استفاده از فرایندکاوی بدون وجود داده های ورودی باکیفیت، به یافته هایی باورپذیر در مورد فرایندهای کسب وکار یک سازمان منجر نخواهد شد. از این رو در سال های گذشته ارزیابی و افزایش کیفیت داده های ورودی به روش های فرایندکاوی، مورد توجه پژوهشگران قرار گرفته است. در این راستا، هدف پژوهش حاضر شناخت و گروه بندی مهم ترین مشکلات کیفیت داده و بازشناخت رویکردهای ارائه شده برای حل این چالش در فرایندکاوی است. روش : روش مورد استفاده در این پژوهش از نوع مرور نظام مند بوده که با هدف واکاوی همه شواهد معتبر، برای پاسخگویی به سوالات پژوهش مورد استفاده قرار گرفته است. در این مطالعه به بررسی و کاوش ۱۰۲ مطالعه دانشگاهی در بین سال های ۲۰۰۷ تا ۲۰۲۱ میلادی پرداخته شده است که شامل پژوهش های انتشار یافته در همایش ها، مجلات و همچنین تعدادی پایان نامه می باشند. بدین منظور از یک روش پژوهش نظا م مند سه بخشی استفاده شده است. در بخش اول که شامل تعریف پژوهش بوده، ابتدا زمینه پژوهش تعریف شده و سپس اهداف و پرسش های پژوهش مشخص شده اند. در گام نهایی این بخش، دامنه پژوهش تعیین گردیده است. در بخش دوم، روش شناسی پژوهش معین شده و معیارهایی برای وارد کردن مطالعات یافت شده به فرایند بررسی نهایی، مشخص شده اند. سپس این مطالعات از لحاظ ارجاعات مورد بررسی قرار گرفته و در پایان دسته بندی شده اند. در بخش سوم که به ارزیابی پژوهش های جمع آوری شده اختصاص یافته است، پژوهش های نهایی مطالعه شده و سپس بر مبنای کاوش آن ها، یافته ها و نتایج حاصل تعیین گردیده اند. با بررسی جامع پژوهش های گردآوری شده، داده ها و شواهد مهم استخراج گردیده و جداول و نمودارهای مورد نیاز نیز رسم شده اند. یافته ها: براساس بررسی پژوهش های انجام شده، توجه به چالش های کیفیت داده در فرایندکاوی در سال های اخیر افزایش یافته است. بیشترین حجم از مطالعات در سال های ۲۰۱۹ و ۲۰۲۰ میلادی منتشر شده اند. همچنین مشخص شد که بیشتر مقالات به ترتیب در سه پایگاه علمی Springer، IEEE و Elsevier انتشار یافته اند. ۵۱ درصد از مطالعات مورد بررسی در همایش ها و کنفرانس های معتبر ارائه شده اند. ۳۶ درصد از پژوهش ها در مجلات معتبر علمی انتشار یافته و ۱۳ درصد از مطالعات از طریق پایان نامه ها و گزارشات دانشگاهی انعکاس یافته اند. برآیندهای حاصل از مطالعه مقالات منتخب نشان داد که ۲۰ مشکل کیفیت داده که می توانند در داده های ورودی پدید آیند، در ادبیات مورد کنکاش قرار گرفته اند. این چالش ها در پنج سطح مسیر فرایند، رویداد، مورد، فعالیت و برچسب زمانی طبقه بندی شده و چهار رویکرد بنیادین که برای ارزیابی و حل چالش های کیفیت داده در فرایندکاوی به کار گرفته شده اند، مشخص گردیدند که شامل: چارچوب های ارزیابی کیفیت داده، پیش پردازش، کشف ناهنجاری، و ترمیم می باشند. یافته ها نشان می دهد که روش های پیش پردازش که هدف آن ها حذف رفتارهای آشفته و کم تکرار از داده های ورودی است، بیشتر از دیگر رویکردها مورد توجه واقع شده اند. همچنین در سال های اخیر کشف ناهنجاری و بازسازی رویدادهای گمشده به جستاری جذاب در زمینه فرایندکاوی تبدیل شده اند. یکی دیگر از نتایج مهم، بررسی مطالعات مربوط به زمینه کیفیت داده در فرایندکاوی، استفاده از حجم وسیعی از رویکردها و روش ها برای حل چالش های کیفیت داده است. بررسی ها نشان داد که استفاده از شبکه های پتری، نقش پر رنگی در همه پژوهش های منتخب به عنوان یک رهیافت ریاضی مد نظر پژوهشگران داشته است. نتیجه گیری: داده های مورد نیاز روش های فرایندکاوی می تواند از مکان های مختلفی به دست آید. یکی از مزایای بزرگ فرایندکاوی این است که مختص به یک نوع سامانه خاص نیست. هر سامانه مبتنی بر گردش کار، فروش بلیط، مدیریت منابع ، پایگاه و انبارهای داده، سامانه های قدیمی و حتی داده هایی که به صورت دستی جمع آوری شده اند، تا زمانی که با استفاده از ویژگی های شناسه مورد، فعالیت و برچسب زمانی قابل تفکیک باشند، قابل تجزیه و تحلیل هستند. اما در مسائل دنیای واقعی، بیشتر داده ها برای اهداف فرایندکاوی جمع آوری نشده اند یا مناسب استفاده برای تحلیل های فرایندکاوی نیستند. به خصوص داده هایی که به صورت دستی ثبت شده اند یا داده هایی که در بین سامانه های جزیره ای مختلف پراکنده شده اند، می توانند حاوی خطا باشند. با وجود تلاش های مناسب برای بهبود کیفیت داده های ورودی در فرایندکاوی، همچنان توسعه چارچوب ها و روش های کارآمد با هدف شناسایی، ارزیابی و حل چالش های کیفیت داده در فرایندهای کسب وکار واقعی که بیشتر اوقات از حجم و پیچیدگی بالایی برخوردارند، پیشنهاد می گردد. نتایج این پژوهش می تواند به عنوان دورنمایی جدید برای پژوهشگران و متخصصان علم داده و تحلیل گران کسب وکار مورد استفاده قرار گیرد.

کلیدواژه ها:

نویسندگان

احمد صالحی

دانشجوی دکتری، گروه مهندسی فناوری اطلاعات، دانشکده مهندسی صنایع و سیستم ها، دانشگاه تربیت مدرس، تهران، ایران

محمد اقدسی

استاد، گروه مدیریت سیستم و بهره وری، دانشکده مهندسی صنایع و سیستم ها، دانشگاه تربیت مدرس، تهران، ایران.

توکتم خطیبی

دانشیار، گروه مهندسی صنایع، دانشکده مهندسی صنایع و سیستم ها، دانشگاه تربیت مدرس، تهران، ایران.

مجید شیخ محمدی

دانشیار، گروه مهندسی سیستم های اقتصادی و اجتماعی، دانشکده مهندسی صنایع و سیستم ها، دانشگاه تربیت مدرس، تهران، ایران.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :