یک مدل برای پیش بینی احتمال سرطان سینه به کمک یادگیری گروهی و ترکیب داده های بزرگ

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 21

فایل این مقاله در 17 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SMARTCITYC03_109

تاریخ نمایه سازی: 20 فروردین 1403

چکیده مقاله:

سرطان سینه، یکی از رایج ترین مشکلات بهداشتی برای زنان در سراسر جهان است. احتمال مراقبت موثر و بهبود بیمار به شناسایی زودهنگام و پیش بینی احتمال سرطان وابستگی مستقیم دارد. الگوریتم های یادگیری ترکیبی و ادغام داده های بزرگ اخیرا به عنوان راه های بالقوه برای پیش بینی و طبقه بندی خطر سرطان سینه ظاهر شده اند. هدف این مقاله، بررسی امکان استفاده از یادگیری ترکیبی و ترکیب داده های بزرگ برای پیش بینی خطر و طبقه بندی سرطان سینه است. تمرکز اصلی ساخت یک مدل قابل اعتماد و دقیق با ترکیب بهترین ویژگی های الگوریتم های یادگیری مختلف و مجموعه داده های متنوع و گسترده است. این تحقیق، یک تکنیک بهبود یافته XGBoost Ensembling (I - XGBoost) را با تحلیل داده های بزرگ برای پیش بینی و تشخیص سلول های سرطان سینه ارائه می دهد. کار پیشنهادی، سه مرحله شناسایی مهم را برای دستیابی به دقت بیشتر در نظر می گیرد: پیش پردازش داده، استخراج ویژگی، و نقش هدف. داده های تشخیصی سرطان سینه ویسکانسین برای آزمایش روش پیشنهادی مورد استفاده قرار گرفت. همچنین از نظر عملکرد با دیگر روش های طبقه بندی مانند درخت تصمیم گیری ، جنگل تصادفی۴، Naive Bayes، KNN، ماشین های بردار پشتیبان ، Adaboost و XGBoost مقایسه می شود. هدف این تحقیق، تعیین این است که کدام ویژگی ها در پیش بینی سرطان به عنوان بدخیم یا خوش خیم، مفیدتر هستند. ما نشان می دهیم که I - XGBoost با استفاده از رابط برنامه نویسی کاربردی پایتون اسپارک (API) دارای امتیاز دقت بسیار بالای ۹۹.۸۴% است.

نویسندگان

طاها عضدی

دانشجوی ارشد نرم افزار، موسسه آموزش عالی آپادانا-شیراز

هاله همایونی

استادیار، گروه کامپیوتر، موسسه آموزش عالی آپادانا-شیراز

زهرا اکرام زاده

کارشناسی ارشد، گروه کامپیوتر، موسسه آموزش عالی آپادانا-شیراز