بررسی مقایسه ای مابین نرم افزارهای مختلف پیرایش و پاکسازی برای RNA-Seq

سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 835

نسخه کامل این مقاله ارائه نشده است و در دسترس نمی باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IBIS04_134

تاریخ نمایه سازی: 14 شهریور 1393

چکیده مقاله:

در حالیکه کمتر از یک دهه از معرفی روش RNA-Seq بعنوان یک روش بیوانفورماتیک می گذرد، روش مذکور با سرعت چشم گیری توسعه پیدا نمودهاست. این پیشرفتها کل مراحل فرآیند این روش از آماده سازی نمونه ها و ابزار انجام آن تا سیستم های پلتفرم ، پردازش و تجزیه و تحلیل داده ها را دربرمیگیرد. فرآیند دستورزی داده های RNA-Seq از کنترل کیفیت بایگانی و آرشیو داده های به دست آمده از پلتفرم و ابزار تعیین توالی ژنتیکی شروع می شود،با پیرایش ، تمیزوغربال نمودن داده ها ادامه می یابد و به تعیین سطح بیان ژنی، تفسیر و هستی شناسی یا انتولوژی ژنی ختم می شود. یکی از عوامل اصلیبرای بررسی ها و تحقیقات مبتنی بر RNA-Seq داشتن داده های خام اولیه پیراسته و تمیزتر در حد امکان است تا بتوان نتایج قابل اعتمادتر و بهتر برایچینش، مونتاژ، نقشه برداری قطعات خوانده شده و همچنین برای تفسیر و تعیین بیان مقایسه ای مختلف ژنی ، چند ریختی تک نوکلئو تیدی یاSNP ها،امتزاج ژنها، هستی شناسی ژن و غیره بدست آورد. برنامه های گوناگونی که در محیط های برنامه نویسی و الگوریتمهای مختلف نوشته شده اند برای پیرایش، تمیزکردن و دستورزی نتایج RNA-Seq به منظور به دست آوردن داده های پیراسته شده تر و تمیزتر برای استفاده در مراحل بعدی پردازش داده ها وجوددارد. سه برنامه که عبارتند از DynamicTrim ، ConDeTri ، clean reads در این تحقیق مورد بررسی و مقایسه قرار گرفتند که بعنوان کاربردی ترین ومورد استفاده ترین برنامه های پیرایش داده های RNA-Seq بکار برده می شوند. برنامهclean_reads بخشی از بسته نرم افزاریngs_backbone ، DyanmicTrim قسمتی از نرم افزار SolexQA و ConDeTri یک نرم افزار مستقل و تنها است. درحالیکه DynamicTrim و clean_reads م ی توانندپیرایش هر کدام از فایلها یPaired End و Single End را بطور جداگانه انجام دهند،ConDeTri فایلهایPaired End را در یک فرآیند یکسان پاکسازی می کند و دو فایل خروجی برای هر دو فایل ورودی Paired End و یک فایل خروجی بعنوان قطعات جفت نشده می دهد. برای مقایسه سه برنامهیاد شده فایلهای RNA-Seq از یک طرح تحقیقاتی ترانسکریپتومیکس نخل روغنی (Ealaeis guineensis Jacq.) بعنوان نمونه های مورد مطالعه استفادهشدند. فایلهای خام و پردازش شده Paired End در قالب شش نمونه هر کدام با دو تکرار که هر نمونه بصورت دو فایل Paired End و مجموعا 42 فایل میباشند به منظور درک اینکه کدام برنامه بهتر عمل می کند و بطورموثرتر و درستتر داده های خام را برای مراحل بعدی تجزیه و تحلیل داده ها پیرایش وپاکسازی می کند مورد بررسی مقایسه و سنجش قرار گرفتند. مطابق با برنامه FastQC که برای مقایسه داده های خام و پیرایش شده از سه برنامه مذکور وبعنوان نرم افزار کنترل کیفی فایلهای حاصل از تعیین توالی ژنتیکی مورد استفاده قرار گرفته است مواردی از قبیل درجه هر باز در توالی ، درجات کیفیبرای توالی ها، محتوای هر باز در توالی، محتوای GC درهر باز پایه، محتوای GC درتوالی، محتوای N در باز، توزیع اندازه قطعات خوانده شده در توالی،سطوح تکرار هر توالی، نسبت جمعیتی تکرار توالی ها و محتوای چندپاری توالی ها Kmer برای فایلها قبل و بعد از پاکسازی توسط برنامه های مذکورمورد بررسی، سنجش و مقایسه قرار گرفته است. مطابق با نتایج حاصله برنامه DyanmicTrim بعنوان بهترین برنامه و سپس به ترتیب برنامه ConDeTri و clean reads انتخاب شدند هرچند که با توجه به تفاوتهای موجود بین برنامه ها، عوامل مختلفی همچون زمان و هدف استفاده کننده از برنامه ها می تو ان آنها را براساس نیاز کاربر نیز درجه بندی نمود.

نویسندگان

سید مهدی جزایری

گروه زیست شناسی دانشگاه ملی کلمبیان

ارنان موریسیو رومرو آنگولو

مرکز تحقیقات نخل روغنی کلمبیا سنی پلما، بوگوتا، کلمبیا

لوز مارینا ملگار خو

مرکز تحقیقات نخل روغنی کلمبیا سنی پالما، بوگوتا، کلمبیا