بهبود الگوریتم خوشه بندی دوگانه EDISA با استفاده از تکنیک هسته های ژنی تکرارشونده

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 354

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CITCOMP03_179

تاریخ نمایه سازی: 31 اردیبهشت 1398

چکیده مقاله:

داده های بیان ژن حاوی اطلاعات موردنیاز برای ساخته شدن پروتیینها هستند و به دودسته سری زمانی و حالت پایدار تقسیم بندی میشوند. این داده ها دارای ویژگیهای خاص ساختاری، بیولوژیکی و معنایی هستند که باید در خوشه بندی موردتوجه قرار بگیرند. اخیرا چندین روش جدید مانند CLICK،CAST و DHC به منظور تسهیل خوشهبندی داده های ژنی مطرحشدهاند. مطالعات نشان میدهد که این روشهای خاص، عملکرد بهتری نسبت به روشهای متداول برای خوشه بندی دارند.EDISA یکی از الگوریتمهای مطرح برای خوشه بندی دوگانه داده های بیان ژن است. این الگوریتم یک روش خوشه بندی احتمالی جدید را برای مجموعه داده های سه بعدی(زمان-شرط-بیان ژن) ارایه میکند. سه تابع مهم در EDISA که عملیات اصلی را انجام میدهندMultiple EDISA ، EDISA و MERGE هستند. این توابع برای یافتن ژنهای با عملکرد مشابه در شرایط یکسان و یا متفاوت بکار گرفته میشوند. Multiple EDISA با انتخاب تصادفی هسته های ژنی شروع میکند و نزدیکترین همسایه را برای یکی از شرایط انتخاب میکند. انتخاب هسته به صورت تصادفی پیاده سازی تابع را ساده تر میکند ولی میتوان با یک روش بهینه در انتخاب هسته، کار آیی الگوریتم را افزایش داد. پیشنهاد مطرح شده در این مقاله استفاده از روشی مجموعه ژنی تکرارشونده بجای انتخاب تصادفی هسته های ژنی است. با بهبود عملکرد تابعMultiple EDISA ، خوشه های دوگانه به دست آمده از دقت بالاتری برخوردار میشوند. الگوریتم بهبودیافتهEDISA بر روی سه مجموعه داده مختلف بکار گرفته شده است. نتایج نشان میدهند به کارگیری مجموعه ژنی تکرارشونده در انتخاب اولیه هسته های ژنی میتواند منجر به یافتن خوشه های دوگانه بیشتر و درعین حال افزایش شباهت در خوشه های دوگانه شود.

نویسندگان

منصوره میرزایی

استادیار گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی گلپایگان، گلپایگان، ایران