CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بهبود الگوریتم خوشه بندی دوگانه EDISA با استفاده از تکنیک هسته های ژنی تکرارشونده

عنوان مقاله: بهبود الگوریتم خوشه بندی دوگانه EDISA با استفاده از تکنیک هسته های ژنی تکرارشونده
شناسه ملی مقاله: CITCOMP03_179
منتشر شده در سومین کنفرانس ملی در مهندسی کامپیوتر، فناوری اطلاعات و پردازش داده ها در سال 1397
مشخصات نویسندگان مقاله:

منصوره میرزایی - استادیار گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی گلپایگان، گلپایگان، ایران

خلاصه مقاله:
داده های بیان ژن حاوی اطلاعات موردنیاز برای ساخته شدن پروتیینها هستند و به دودسته سری زمانی و حالت پایدار تقسیم بندی میشوند. این داده ها دارای ویژگیهای خاص ساختاری، بیولوژیکی و معنایی هستند که باید در خوشه بندی موردتوجه قرار بگیرند. اخیرا چندین روش جدید مانند CLICK،CAST و DHC به منظور تسهیل خوشهبندی داده های ژنی مطرحشدهاند. مطالعات نشان میدهد که این روشهای خاص، عملکرد بهتری نسبت به روشهای متداول برای خوشه بندی دارند.EDISA یکی از الگوریتمهای مطرح برای خوشه بندی دوگانه داده های بیان ژن است. این الگوریتم یک روش خوشه بندی احتمالی جدید را برای مجموعه داده های سه بعدی(زمان-شرط-بیان ژن) ارایه میکند. سه تابع مهم در EDISA که عملیات اصلی را انجام میدهندMultiple EDISA ، EDISA و MERGE هستند. این توابع برای یافتن ژنهای با عملکرد مشابه در شرایط یکسان و یا متفاوت بکار گرفته میشوند. Multiple EDISA با انتخاب تصادفی هسته های ژنی شروع میکند و نزدیکترین همسایه را برای یکی از شرایط انتخاب میکند. انتخاب هسته به صورت تصادفی پیاده سازی تابع را ساده تر میکند ولی میتوان با یک روش بهینه در انتخاب هسته، کار آیی الگوریتم را افزایش داد. پیشنهاد مطرح شده در این مقاله استفاده از روشی مجموعه ژنی تکرارشونده بجای انتخاب تصادفی هسته های ژنی است. با بهبود عملکرد تابعMultiple EDISA ، خوشه های دوگانه به دست آمده از دقت بالاتری برخوردار میشوند. الگوریتم بهبودیافتهEDISA بر روی سه مجموعه داده مختلف بکار گرفته شده است. نتایج نشان میدهند به کارگیری مجموعه ژنی تکرارشونده در انتخاب اولیه هسته های ژنی میتواند منجر به یافتن خوشه های دوگانه بیشتر و درعین حال افزایش شباهت در خوشه های دوگانه شود.

کلمات کلیدی:
داده های بیان ژن، خوشه بندی دوگانه، الگوریتم EDISA ، هسته ژنی، مجموعه ژن تکرارشونده.

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/854053/