بررسی روش های داده کاوی در پیش بینی سرطان پستان

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 964

نسخه کامل این مقاله ارائه نشده است و در دسترس نمی باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

THPC01_015

تاریخ نمایه سازی: 26 مرداد 1397

چکیده مقاله:

مقدمه: سرطان بیماری است که سالیانه بیش از 6/7 میلیون نفررا به کام مرگ می کشاند. از میان سرطان ها، سرطان پستان به عنوان دومین بیماری شایع زنان مطرح می شود. براساس آمار جهانی سالیانه، 600000 مورد مرگ و میر به علت سرطان پستان ثبت شده است . در علم پزشکی به علت وجود تعداد پارامترهای متعدد در تشخیص بیماری، حتی تشخیص برای یک متخصص خبره بسختی امکان پذیر می باشد. به این علت در چند دهه اخیر از ابزارها و تکنولوژی های جدیدی برای تحقق این امر خطیر استفاده می گردد. یکی از این تکنولوژی ها داده کاوی است. داده کاوی یک ابزار قدرتمند برای استخراج الگوهای ناشناخته و اطلاعات مفید از مجموعه داده های بزرگ بسیار مناسب است. در پژوهش حاضر با بررسی مطالعات انجام گرفته درباره پیش بینی بیماری سرطان پستان که از متد داده کاوی استفاده نموده اند، پتانسیل ارزشمند این روش ها را در استخراج دانش و ایجاد مدل برای پیش بینی سرطان پستان نشان دهیم . روش کار: این پژوهش، یک مطالعه مروری بوده که به منظور یافتن مقالات مرتبط، جستجوی در پایگاه های اطلاعاتیGoogle scholar ،SID ، Scopus و PubMed با استفاده از ترکیبی از کلیدواژه های: breast cancer ، Data Mining، Machine Learning ، Knowledge discovery in data base در بازه زمانی 2018-2005 صورت گرفت. در نهایت، 24 مقاله معیارهای ورود به مطالعه را داشتند.یافته ها: مطالعات در سه بخش تعداد حجم نمونه، عوامل مرتبط با سرطان پستان، نرم افزارهای مورد استفاده در مطالعات برای داده کاوی و تحلیل صحت، دقت، حساسیت با یکدیگر مقایسه میگردند. 11مطالعه درکشور ایران و مابقی در کشورهای دیگر جهان اجرا شده است. در مقالات موجود در پژوهش تعداد حجم نمونه از 547 تا202،932 رکورد متغییر می باشد، در اکثریت مطالعات از دو دیتاست محلی و استاندارد و نرم افزارهای Matlab،clementine ،Weka استفاده گردیده است.13 مطالعه از الگوریتم شبکه عصبی، مابقی از الگوریتم های درخت تصمیم گیری، ماشین بردار پشتیبان، بیزین و رگرسیون استفاده کرده بودند. دراکثریت مقالات میزان صحت، دقت، حساسیت، محاسبه شده بود. متغییرهایی که بیشترین تکرار را در مقالات مختلف داشته اند عبارتند از سن، وضعیت تاهل، گیرنده هورمونی استروژن، گیرنده هورمونی پروژسترون، تعداد غدد لنفاوی درگیر می باشد.نتیجه گیری: از مقایسه مقاله ها می توان این گونه استدلال نمود که دقت، حساسیت و ویژگی الگوریتم های مختلف براساس ماهیت مجموعه داده استفاده شده مانند: تعداد رکوردها و متغیرهای گردآوری شده، تعادل متغیر هدف، تعداد مقادیر مفقوده و همچنین نوع روش های استفاده شده در پیش پردازش داده ها و نرم افزارها و الگوریتم های بکار رفته شده می تواند متفاوت می باشد. لازم به ذکر است که نوع روش داده کاوی از لحاظ نظارتی و غیرنظارتی هم در نتایج به دست آمده دخیل است. به طور قطع نمی توان بیان نمود که یک الگوریتم عملکرد بهتری نسبت به الگوریتم دیگر دارد.

کلیدواژه ها:

نویسندگان

هادی لطف نژاد افشار

استادیار گروه فناوری اطلاعات سلامت، دانشکده پیراپزشکی، دانشگاه علوم پزشکی ارومیه، ارومیه، ایران

بهلول رحیمی

دانشیار گروه فناوری اطلاعات سلامت، دانشکده پیراپزشکی، دانشگاه علوم پزشکی ارومیه، ارومیه، ایران

زهرا هادیان فر

دانشجوی کارشناسی ارشد انفورماتیک پزشکی، دانشکده پیراپزشکی، دانشگاه علوم پزشکی ارومیه، ارومیه، ایران وابستگی سازمانی: کمیته تحقیقات دانشجویی دانشگاه علوم پزشکی ارومیه