فیدیبو نماینده قانونی انتشارات دانشگاه تهران و بیش از ۶۰۰ ناشر دیگر برای عرضه کتاب الکترونیک و صوتی است .
کتاب نسل جدید فناوری‌های توالی‌یابی و چالش‌های سرهم‌سازی توالی‌ها

کتاب نسل جدید فناوری‌های توالی‌یابی و چالش‌های سرهم‌سازی توالی‌ها

نسخه الکترونیک کتاب نسل جدید فناوری‌های توالی‌یابی و چالش‌های سرهم‌سازی توالی‌ها به همراه هزاران کتاب دیگر از طریق فیدیبو به صورت کاملا قانونی در دسترس است. تنها لازم است اپلیکیشن موبایل و یا نرم افزار ویندوزی رایگان فیدیبو را نصب کنید.

درباره کتاب نسل جدید فناوری‌های توالی‌یابی و چالش‌های سرهم‌سازی توالی‌ها

یکی از ویژگی‌های شایان توجه فناوری‌های جدید توالی‌یابی بازده و خروجی انبوه آنهاست که به صدها، هزارها و حتی میلیون‌ها توالی خوانده‌شدۀ کوتاه، بالغ می‌شود. در نتیجه، تحقیق در حوزۀ نسل جدید توالی‌یابی را می‌توان تحقیقی بین رشته‌ای به‌حساب آورد که هم‌زمان به دانش زیست‌شناسی و مهارت‌های محاسباتی نیاز دارد. در حقیقت، باید گفت که تجزیه و تحلیل داده‌های حاصل از نسل جدید توالی‌یابی نیازمند امکانات محاسباتی پرقدرت و افراد بسیار چیره‌دست در بیوانفورماتیک است.
صرف‌نظر از قابلیت‌ها و مزایای نسل جدید توالی‌یابی، چالش‌هایی نیز به همراه آن وجود دارد که پیشرفت‌ها و بهینه‌سازی‌های مداوم در زمینۀ فناوری‌های توالی‌یابی، زیرساخت‌های محاسباتی و تکنیک‌های بیوانفورماتیک را می‌طلبد تا از این طریق بتوان نتایج خامِ حاصل را تحلیل و از آنها برای سَرهَم‌سازی و مستندسازی و تفسیر کل ژنوم یا ترانسکریپتوم استفاده کرد. چنین پیشرفت‌هایی سبب توسعه‌ و افزایش تلاش‌ها برای ارتقای عملکرد و سطح پوشش توالی‌یابی شده است و سبب شده که کیفیت توالی‌های سرهم‌سازی‌شده به شکل شایان توجهی بهبود یابد. با وجود این، مواردی همچون کوتاه‌بودن طول خوانش‌ها، خطاهای اختصاصی هر روشِ توالی‌یابی و هر دستگاه و نیاز به حافظه‌های بسیار بزرگ برای انجام سرهم‌سازی، هنوز از جدی‌ترین چالش‌های این حیطه محسوب می‌شوند.
این کتاب به عنوان زیرمجموعه‌ای از SpringerBriefs، به طور خلاصه به مرور تاریخچه، مراحل پیشرفت، روش‌ها، کاربردها و چالش‌های نسل جدید توالی‌یابی می‌پردازد. برای این کتاب سه بخش در نظر گرفته شده است که عبارت‌اند از: بخش ۱- که به معرفی اصول زیست‌شناسی مولکولی، الگوریتم‌ها و دادهْ ساختارهای مربوطه می‌پردازد که برای خواندن بخش‌های تخصصی‌تر کتاب لازم‌اند (گفتار ۱ و ۲). بخش ۲- به روش‌ها و دستگاه‌های نسل جدید توالی‌یابی و همچنین کاربردها، چالش‌ها و پیشرفت‌های اخیر این نوع فناوری می‌پردازد (گفتارهای ۳ تا ۷) و در نهایت، بخش ۳ کتاب است که به مراحل سرهم‌سازی توالی‌ها در نسل جدید توالی‌یابی و شیوۀ صحت‌سنجی و امتیازدهی مربوطه و ابزارهای مورد استفاده و مشکلات حل‌نشدۀ آن متمرکز شده است (گفتارهای ۸ تا ۱۱).

ادامه...
  • ناشر انتشارات دانشگاه تهران
  • تاریخ نشر
  • زبانفارسی
  • حجم فایل 2.86 مگابایت
  • تعداد صفحات ۱۷۸ صفحه
  • شابک

معرفی رایگان کتاب نسل جدید فناوری‌های توالی‌یابی و چالش‌های سرهم‌سازی توالی‌ها

شما به آخر نمونه کتاب رسیده‌اید، برای خواندن نسخه کامل، کتاب الکترونیک را خریداری نمایید و سپس با نصب اپلیکیشن فیدیبو آن را مطالعه کنید:



پیشگفتار مترجمان

نسل جدید توالی یابی یا Next-Generation Sequencing (NGS) مجموعه ای از روش ها و فناوری های پیشرفته را شامل می شود که تعیین توالی عناصر ژنتیکی را هدف گرفته است و بیش از یک دهه از عمر آن نمی گذرد. اگر روش سنتی توالی یابی سَنِر یا Sanger Sequencing را نسل اول و روش های اتوماتیک توالی یابی سَنِر را نسل دوم بنامیم، نسل جدید توالی یابی DNA در واقع سومین نسل از این مجموعه دانش است و اکنون دیگر بی تردید می توان آن را از لحاظ سرعت، دقت، حجم انبوه داده های تولیدی و البته قیمت تمام شده هر پروژه، رخدادی بی نظیر در عرصه زیست شناسی مولکولی و دانش های وابسته به آن به حساب آورد. اگر به تاریخ علم با دیدی واقع بینانه بنگریم، شاید بتوان موارد معدودی یافت که نوعِ بشر آرزویی دست نیافتنی را در ذهن خویش پرورده و سپس به آن دست یافته است. بی گمان نسل جدید توالی یابی مصداقی از این مورد است، بدین معنی که در دو دهه پیش اگر کسی به فکر تعیین توالی کُل ژنوم انسانی با هزینه ای در حدود هزار دلار و در مدت زمان کم تر از سه روز بود، انجام آن را فقط می توانست در رویای خویش جست وجو کند، و حتی در داستان های علمی - تخیلی نیز کم تر می توان ردپایی از آن یافت. امروزه به لطف دستگاه هایی همچون Roche ۴۵۴، PACBIO RS II، Ion Torrent، Illumina HiSeq ۴۰۰۰، HiSeq X Five، MiSeq FGx و Oxford Nanopore Technology و پِلاتفُرم های متعدد دیگر، این رویا به حقیقت پیوسته است.
پرداختن به فواید و کاربردهای نسل جدید توالی یابی در رشته های مختلف، خود کتابی پُر برگ را طلب می کند و تقریبا هیچ پژوهشی را نمی توان سراغ گرفت که بخشی از آن به عناصر ژنتیکی مربوط باشد و نتواند از دست آوردهای درخشان این فناوری های پُربازده استفاده کند. در حیطه منابع طبیعی و کشاورزی شاید بتوان به صورت فهرست وار به تعیین توالی کُل ژنوم در گونه های اقتصادی و گونه های در معرض خطر انقراض، بِه گُزینی مبتنی بر نشانگرهای پراکنده شده در کُل ژنوم، یافتن ژن های مختلف دخیل در صفات و ویژگی های مطلوب - از چند قلوزایی و تولید پشم و شیر در احشام گرفته تا افزایش سرعت رشد و مقاومت در برابر استرس های محیطی و بیماری ها در گیاهان و آبزیان - جست وجوی عوامل ژنتیکی دخیل در تعیین جنسیت و زمان رسیدگی جنسی و ترسیم دقیق مسیرهای ژنتیکی بُروز صفات اقتصادی اشاره کرده و البته صدها کاربرد ارزشمند دیگر را نیز به فهرست مورد نظر اضافه کرد.
هدف ما از برگردان این کتاب ارائه متنی کاربردی، موجز و البته روزآمد در مورد این فناوری نوین و روش های محاسباتی و تجزیه و تحلیل داده های آن به زبان فارسی بوده است و تلاش کرده ایم که تا جای ممکن بر سادگی بیان آن تمرکز کنیم. همچنین، ازآنجاکه معمولاً جدی ترین چالش ترجمه هایی که به نوعی با فناوری های جدید سروکار دارند یافتن معادل های مناسب در زبان مقصد است، سعی کرده ایم که از افراط و تفریط در این زمینه بپرهیزیم و ساختار علمی کتاب را با به کاربردن واژگان نامانوس، خدشه دار نکنیم. به ویژه که احتمالاً کتاب پیش رو یکی از اولین متون فارسی است که به شکل انحصاری به موضوع نسل جدید توالی یابیِ ژنوم می پردازد.
یکی از ویژگی های شایان توجه این کتاب این است که، ضمن مرور انواع فناوری های جدید و ابزارها و دستگاه های مربوطه، بخش عمده مباحث خود را به روش استفاده و تحلیل داده های تولیدی از این نوع دستگاه ها معطوف داشته است. افرادی که آشنایی مختصری با پروژه های نسل جدید توالی یابی دارند نیز به خوبی می دانند که معمولاً در این پروژه ها اهمیت تجزیه و تحلیل داده های به دست آمده بسیار بیشتر از اهمیت نحوه تولید خود آن داده هاست. درحقیقت، بیوانفورماتیکِ مرتبط با نسل جدید توالی یابی از مهم ترین چالش های امروزه بیولوژیست ها و ژنتیک دانان محسوب می شود، زیرا معمولاً صاحب نظران این رشته ها در علوم رایانه ای و محاسباتی چندان چیره دست نیستند و اگر هم با بیوانفورماتیک آشنا باشند، ماهیتِ در حال تغییر و تکامل روش های مورد استفاده احتمال به روزبودن معلومات آنها را کاهش می دهد. هرچند در زمان نوشته شدن این سطور نسل جدید تری از فناوری های توالی یابی به عنوان Next-Next-Generation Sequencing مراحل پایانی تولید تجاری خود را طی می کند، ظاهرا بدان دلیل که سرعت پیشرفت ما در دانش ریاضی و الگوریتم ها و روش های محاسباتی کُندتر از شتاب رشد فناوری است، مباحثی که در زمینه بیوانفورماتیک در اینجا مطرح شده می تواند برای پژوهشگران این عرصه تا مدت ها کارگشا باشد.
نویسندگان کتاب، Mohamed Helmy پژوهشگر مقطع پَسادکترا در دانشگاه تورنتو است و دکترای خود را در زمینه زیست شناسی سامانه ای (system biology) از دانشگاه Keio ژاپن اخذ کرده است. Sara El-Metwally عضو هیئت علمی دانشکده کامپیوتر و علوم ارتباطات دانشگاهMansoura مصر است و Osama Ouda نیز استادیار دانشکده علوم رایانه ای در همان دانشگاه است و در زمینه ها ی پردازش تصویر و تشخیص الگو که از مباحث یادگیری ماشینی محسوب می شود به تدریس و پژوهش مشغول است.
در پایان باید گفت که کارهایی از این قبیل حتماً خالی از ایراد نخواهند بود و اصولاً ذات رویکرد علمی نیز چنین است که خطا (و البته اصلاح خطا) دوشادوش آن گام برمی دارد. هرچند تلاش کرده ایم که متن پیش رو از هر لحاظ خالی از عیب و کاستی باشد، بنا به دلایلی که به برخی از آنها در همین مقدمه اشاره شد، بی شک نمی توانیم ادعای رسیدن به مقصود را داشته باشیم. لطف ارزش یابی این برگردان بر گردن خوانندگان و مخاطبان فرهیخته است و هرگونه راه نمایی و راه گشایی در این راهِ لغزنده برای ما بسیار ارزنده خواهد بود.

مقدمه نویسندگان

ظهور نسل جدید فناوری های توالی یابی (NGS) تغییری انقلابی در ابزارهایی به وجود آورد که دانشمندان به کمک آنها می توانستند اطلاعات ژنتیکی را از سیستم های زیستی استخراج کنند و اطلاعات تقریباً بی انتهایی را در اختیار پژوهشگران گذاشت که می توانست از ژنوم، ترانسکریپتوم و اِپی ژنوم گونه های مختلف ناشی شود. پس از پروژه ژنوم انسان که پیش گام مطالعات این چنینی بود، مطالعات ژنومی دیگری نیز در مقیاس کلان در سرتاسر جهان آغاز شد که سنگ بنای همه آنها نسل جدید فناوری های توالی یابی بود. به علاوه، استفاده از این روش های نوین در حوزه بالینی، پیشرفت چشمگیری در تشخیص ژن های دخیل در انواع سرطان ها و سایر بیماری های مهلک را به همراه داشته است.
یکی از ویژگی های شایان توجه فناوری های جدید توالی یابی بازده و خروجی انبوه آنهاست که به صدها، هزارها و حتی میلیون ها توالی خوانده شده کوتاه، بالغ می شود. در نتیجه، تحقیق در حوزه نسل جدید توالی یابی را می توان تحقیقی بین رشته ای به حساب آورد که هم زمان به دانش زیست شناسی و مهارت های محاسباتی نیاز دارد. در حقیقت، باید گفت که تجزیه و تحلیل داده های حاصل از نسل جدید توالی یابی نیازمند امکانات محاسباتی پرقدرت و افراد بسیار چیره دست در بیوانفورماتیک است.
صرف نظر از قابلیت ها و مزایای نسل جدید توالی یابی، چالش هایی نیز به همراه آن وجود دارد که پیشرفت ها و بهینه سازی های مداوم در زمینه فناوری های توالی یابی، زیرساخت های محاسباتی و تکنیک های بیوانفورماتیک را می طلبد تا از این طریق بتوان نتایج خامِ حاصل را تحلیل و از آنها برای سَرهَم سازی و مستندسازی و تفسیر کل ژنوم یا ترانسکریپتوم استفاده کرد. چنین پیشرفت هایی سبب توسعه و افزایش تلاش ها برای ارتقای عملکرد و سطح پوشش توالی یابی شده است و سبب شده که کیفیت توالی های سرهم سازی شده به شکل شایان توجهی بهبود یابد. با وجود این، مواردی همچون کوتاه بودن طول خوانش ها، خطاهای اختصاصی هر روشِ توالی یابی و هر دستگاه و نیاز به حافظه های بسیار بزرگ برای انجام سرهم سازی، هنوز از جدی ترین چالش های این حیطه محسوب می شوند.
این کتاب به عنوان زیرمجموعه ای از SpringerBriefs، به طور خلاصه به مرور تاریخچه، مراحل پیشرفت، روش ها، کاربردها و چالش های نسل جدید توالی یابی می پردازد. برای این کتاب سه بخش در نظر گرفته شده است که عبارت اند از: بخش ۱- که به معرفی اصول زیست شناسی مولکولی، الگوریتم ها و دادهْ ساختارهای مربوطه می پردازد که برای خواندن بخش های تخصصی تر کتاب لازم اند (گفتار ۱ و ۲). بخش ۲- به روش ها و دستگاه های نسل جدید توالی یابی و همچنین کاربردها، چالش ها و پیشرفت های اخیر این نوع فناوری می پردازد (گفتارهای ۳ تا ۷) و در نهایت، بخش ۳ کتاب است که به مراحل سرهم سازی توالی ها در نسل جدید توالی یابی و شیوه صحت سنجی و امتیازدهی مربوطه و ابزارهای مورد استفاده و مشکلات حل نشده آن متمرکز شده است (گفتارهای ۸ تا ۱۱).
کتاب به شکلی تنظیم شده که مخاطبانی را که به تازگی وارد حیطه توالی یابی شده و پیش زمینه اطلاعاتی در مورد زیست شناسی و علوم رایانه ای دارند را پوشش دهد. ما مفاهیم مقدماتی مربوط به هر دوی این علوم را که با توالی یابی مرتبط اند ارائه کرده ایم تا خوانندگان بتوانند از مزیت اختلاط این علوم، که منشا پیشرفت های اخیر در توالی یابی بوده است، استفاده کنند. همچنین این کتاب می تواند برای خوانندگانی که در توالی یابی دارای تجربه اند نیز مورد استفاده قرار گیرد. به همین دلیل، در بخش های ۲ و ۳ شرح و معرفی مبسوطی از موضوعات مطرح در زمینه توالی یابی آمده و به موانع رایجی که در ارتباط با پیچیدگی های تکنیکی، میزان در دسترس بودن و نیاز مداوم به برخی منابع در آنها وجود دارد اشاره شده است. به علاوه، در گفتار ۱۰، به جدید ترین روش های ارزیابی فرآیند سرهم سازی در نسل جدید توالی یابی نظری اجمالی خواهیم داشت.

Sara El-Metwally, M.Sc.
Osama M. Ouda, Ph.D.
Mohamed Helmy, Ph.D.

بخش اول: مقدمه ای بر زیست شناسی مولکولی و اصول بیوانفورماتیک در نسل جدید توالی یابی

فصل اول: مبانی زیست شناسی مولکولی نسل جدید توالی یابی

چکیده
جانداران را می توان به دو دسته جانداران ساده (یا تک سلولی) و جانداران پیچیده (یا پرسلولی) تقسیم بندی کرد. هر دو گروه از این جانداران دارای فرآیندهای سلولی و زیستی عمده مشترکی هستند که به واسطه پروتئین ها و اسیدهای نوکلئیک انجام می شوند. پروتئین ها را می توان مولکول های مسئول انجام دادن تمام فرآیندهای ساختاری و زیستی به شمار آورد که درون سلول یا در جاندار زنده رخ می دهند، در حالی که اسیدهای نوکلئیک وظیفه رمزگذاری(۱) اطلاعات لازم برای ساختن و تنظیم پروتئین ها را بر عهده دارند. در این گفتار برخی از اصول زیست شناسی مولکولی را بیان می کنیم تا خوانندگانی که زمینه ای از دانش زیست شناسی ندارند به حد کفایت با موضوع مورد بحث آشنا شوند. دانستن این اصول کمک چشمگیری به افراد غیرمتخصص برای فهم این کتاب و سایر منابع و کتاب های زیست شناسی محاسباتی خواهد کرد. افرادی که تجربه درخور توجهی در زیست شناسی دارند می توانند از خواندن این گفتار صرف نظر کنند.

۱-۱: زیست شناسی مولکولی

زیست شناسی مولکولی را می توان علم مطالعه اصول مولکولی دخیل در انجام دادن و تنظیم فرآیندهای زیستی تعریف کرد. این فرآیندهای زیستی که همانندسازی(۲)، رونویسی(۳) و ترجمه(۴) عناصر یا مواد ژنتیکی(۵) را نیز شامل می شوند نیازمند وجود، برهم کُنش و تنظیم هزاران پروتئین و ژن های مربوط به آنها می باشند. بنابراین حیطه تمرکز زیست شناسی مولکولی از کشف و درک ساختار و عملکرد این پروتئین ها / ژن ها آغاز می شود و با مطالعه فرآیندهای تنظیمی و برهم کُنش های میان آنها ادامه می یابد. به علاوه، اثرهای فقدان و یا تغییرات ناشی از جهش آنها نیز باید مورد مطالعه قرار گیرد(۱ و ۲).
تفاوت های اساسی بین جانداران مختلف در سطح مولکولی دیده می شود، که برای ایجاد تنوعی که بین جانداران ساده و پیچیده وجود دارد، ضروری است. به طور کلی، جانداران بر اساس ساختار سلولی و ژنومی خود به دو گروه اصلی تقسیم بندی می شوند که بر همین اساس، جانداران ساده با ساختار تک یاخته ای با نام پروکاریوت ها(۶) و جانداران پیچیده تر یوکاریوت(۷) نامیده می شوند.
البته تفاوت های بین یوکاریوت ها و پروکاریوت ها بدین سادگی نیست که به تعداد سلول های تشکیل دهنده ساختار آنها محدود شود، بلکه شامل موارد دیگری نیز هست که با موضوع بحث این کتاب بسیار مرتبط اند. یک اختلاف عمده بین این دو گروه، به ساختار ژنوم آنها مربوط است. ژنوم در پروکاریوت ها حلقوی و فاقد پروتئین است و به شکل بارزی تِلومر(۸) در آنها وجود ندارد. در حالی که در یوکاریوت ها، ژنوم دارای تِلومر و پروتئین است که در شکل گیری کروماتین نقشی حیاتی ایفا می کنند. وجود چنین تفاوت هایی تاثیر بسزایی در فرآیند توالی یابی ژنوم و سرهم سازی(۹) ژنوم های توالی یابی شده خواهد گذاشت، که در گفتارهای بعد به آن اشاره می کنیم. تفاوت های اصلی پروکاریوت ها و یوکاریوت ها در جدول ۱-۱ آمده است (۱ و ۲).
از آنجا که زیست شناسی مولکولی در پی درک عمیق ساختار مولکول ها و بر هم کنش بین آنهاست، گاهی با علوم دیگر نظیر بیوشیمی نیز نقاط مشترکی خواهد داشت. به علاوه، با پیشرفت ابزارهای نوین آزمایشی و تحلیلی، همچون نسل جدید توالی یابی ژنوم(۱۰) (NGS) و طیف سنجی جرمی کروماتوگرافی مایع(۱۱) (LC-MS/MS) که بنا بر ماهیت خود می توانند حجم انبوهی از داده ها(۱۲) را تولید کنند (۳)؛ زیست شناسی مولکولی نیازمند ابزارهای محاسباتی و انفورماتیک تخصصی است تا بتواند اطلاعات مذکور را تجزیه و تحلیل کند. به همین دلیل اشتراکات فراوانی بین زیست شناسی مولکولی، زیست شناسی محاسباتی(۱۳) و بیوانفورماتیک وجود دارد (۱ و ۲).
برای افزایش آگاهی از جزئیات فرآیندهای سلولی در سطح مولکولی، سه نوع خاص از مولکول ها را باید دقیق تر مورد مطالعه قرار داد: اسید دی اکسی ریبونوکلئیک (DNA)، اسید ریبونوکلئیک (RNA) و پروتئین ها. در بخش های بعد، شرح مختصری درباره هر کدام از آنها خواهد آمد.

جدول ۱-۱: تفاوت های اصلی بین پروکاریوت ها و یوکاریوت ها



۱-۱-۱: اسید دی اکسی ریبونوکلئیک

DNA یکی از دو نوع اسید نوکلئیکی است که در جانداران زنده وجود دارد و نقشی کلیدی در زیست شناسی سلول ایفا می کند. از لحاظ ساختاری، DNA واجد یک زنجیره دو رشته ای است که از تکرار واحدهای بازی مشابه به نام نوکلئوتید ساخته شده است. هر نوکلئوتید شامل یک مولکول قند با نام ’۲ - دِاُکسی ریبوز(۱۴)، رزیدو(۱۵) یا باقیمانده فسفات و یک باز نیتروژن دار است. مولکول قند دارای پنج اتم کربن است (که از ´۱ تا ´۵ چیده شده اند). وجود رزیدوی فسفات برای ایجاد زنجیره از طریق اتصال اتمِ کربن ´۳ مولکولِ قند یک نوکلئوتید با اتم کربن شماره ´۵ مولکول قند نوکلئوتید بعدی، حائز اهمیت است. در نتیجه، مولکول DNA دارای جهت گیری(۱۶) یا ترتیبی است که از انتهای ´۵ آغاز شده و به انتهای ´۳ ختم می شود (شکل ۱-۱ الف). همان طور که بعداً خواهید دید، این خصوصیت به ویژه برای توالی یابی DNA و در زمان سرِهَم کردنِ توالی ها دارای اهمیت است. همه توالی های DNA موجود در داده پایگاه ها(۱۷)، مقالات یا کتاب ها به صورت ´۵ به ´۳ نوشته می شوند مگر اینکه خلاف آن در منبع مورد نظر ذکر شده باشد (۲و۴).



شکل ۱-۱: ساختار DNA. (الف) مثالی از ۱۲ جفت باز مکمل. (ب) طرح شماتیک نوکلئوتیدهای DNA شامل پورین ها (تک حلقه ای) و پیریمیدین ها (دو حلقه ای). (پ) ساختار مارپیچ دو رشته ای DNA. حرف r علامت قند دِاُکسی ریبوز است. حرف p علامت گروه فسفات، و خطوط نقطه چین نشانه پیوندهای هیدروژنی بین نوکلئوتیدهای دو رشته است.

بازهای نیتروژن دار به اتم کربن ´۱ نوکلئوتید متصل می شوند. چهار نوع باز وجود دارد که عبارت اند از: آدنین (A)، گوانین (G)، سیتوزین (C) و تیمین (T). در نتیجه چهار نوع نوکلئوتید نیز وجود خواهد داشت. آدنین و گوانین به گروهی با نام پورین ها تعلق دارند، در حالی که سیتوزین و تیمین به گروه پیریمیدین ها متعلق اند (شکل ۱-۱ ب). وقتی که DNA به شکل دو رشته ای در می آید، یک نوکلئوتید از گروه پورین با نوکلئوتیدی از گروه پیریمیدین در رشته مقابل اتصال برقرار کرده است. آدنین همیشه به تیمین و سیتوزین همیشه به گوانین متصل می شود و این اتصال از طریق پیوند ضعیف هیدروژنی صورت می گیرد (شکل ۱-۱ پ). این امر سبب می شود که دو رشته به هم متصل بوده و در عین حال فاصله آنها از یکدیگر به یک اندازه باشد. در نتیجه این ویژگی است که مارپیچ دو رشته ای معروف DNA ایجاد می شود. این جفت نوکلئوتیدها را به عنوان بازهای مکمل یا جفت بازهای واتسن-کریک(۱۸) می شناسند و از آنها به عنوان واحدی برای سنجش طول DNA استفاده می کنند. برای مثال یک توالی DNA با ۲۰۰۰ نوکلئوتید به عنوان ۲۰۰۰ جفت باز(۱۹) (bp) یا ۲ کیلو جفت باز (kbp) معرفی می شود (۲).
در زیست شناسیِ محاسبه ای و بیوانفورماتیک، یک توالی DNA به عنوان یک رشته (یک توالی از کاراکترها) شامل ترکیبی از ۴ حرف A، G، C و T شناخته می شود. بنابراین، بر اساس رابطه مکملی بازها، می توان به سادگی با جایگزینی A، T، C، و G با T، A، G و C، ساختار توالی رشته DNA مکمل(۲۰) را (که از ´۳ آغاز و به ´۵ خاتمه می یابد) پیش بینی کرد. این عمل در واقع بسیار شبیه همان چیزی است که در سلول های زنده رخ می دهد، که هر رشته از مولکول DNA رشته مکمل خود را می سازد. این فرآیند به DNA امکان همانند سازی و ساختن دو نسخه مشابه از کل DNA را در زمان تقسیم سلولی و تولید دو سلول با نسخه های مشابه از DNA ژنومی را می دهد (۲و۴).

۲ -۱-۱-: اسید ریبونوکلئیک

RNA دومین نوع از اسیدهای نوکلئیک است که در سلول های زنده وجود دارد. غیر از چند تفاوت بارز، RNA دارای همان ساختار کلی و ویژگی هایی است که برای DNA برشمردیم. برخلاف DNA، RNA تک رشته ای است که در آن مولکول قند موجود در نوکلئوتیدها، به جای’۲ -دِاُکسی ریبوز، ریبوز است. همچنین باز تیمین (T) در RNA وجود ندارد و به جای آن باز یوراسیل (U) وجود دارد. بنابراین، این یوراسیل است که با آدنین (A)، مشابه آنچه در DNA در مورد تیمین دیده می شود، متصل خواهد شد. با توجه به آنچه گفته شد، می توان توالی RNA را از روی توالی DNA، فقط با جایگزین کردن A، U، C، و G با T، A، G و C پیش بینی نمود، و برعکس. البته یکی دیگر از تفاوت های اساسی بین DNA و RNA این است که فقط یک وظیفه اصلی برای DNA در نظر گرفته می شود (رمزگشایی از اطلاعات ژنتیکی جانداران) در حالی که چندین نوع مختلف از RNA وجود دارد که وظایف مختلفی بر عهده دارند. همچنین شایان ذکر است که RNA نیز می تواند به شکل دو رشته ای در آید. دیده شده که، در برخی از ویروس ها ماده ژنتیکی به جای DNA، RNA دو رشته ای(۲۱) (ds-RNA) بوده است (۲و۵). این RNA دو رشته ای ویروسی نقش مهمی در تشخیص ویروس توسط سیستم های ایمنی، مانند آنچه در انسان وجود دارد، ایفا می کند (۶).
سه نوع اصلی از RNA وجود دارند که نقش بارزی در فرآیند سنتز پروتئین ایفا می کنند. RNA پیامبر(۲۲) (mRNA)، RNA ریبوزومی(۲۳) (rRNA) و RNA ناقل(۲۴) (tRNA). به غیر از اینها، چندین نوع دیگر از RNA در سلول وجود دارند که در تغییرات پس از رونویسی(۲۵) و یا موارد تنظیمی نقش مهمی بر عهده دارند (جدول ۲-۱). اکنون به معرفی مختصر انواع اصلی RNA که در نسل جدید توالی یابی اهمیت دارند خواهیم پرداخت.
mRNA در نتیجه رونویسی RNA حاصل می شود (شکل ۲-۱ الف)؛ و رونویسی فرآیندی است که در آن یک رشته RNA، که مکمل بخش ویژه ای از DNA ژنومی است، ایجاد می شود. این RNA به شکلی رمزگذاری شده که به درستی تمامی اطلاعات لازم برای ساخت پروتئین، از طریق ترجمه توالی RNA "رمزگذاری شده" به یک توالی اسید امینه را در خود دارد. در صفحات بعد جزئیات بیشتری از این مطلب خواهد آمد. در پروکاریوت ها، در بیشتر موارد، mRNA مستقیماً به یک پروتئین ترجمه می شود. اما در یوکاریوت ها این فرآیند پیچیده تر خواهد بود، زیرا mRNA آنها شامل نواحی کُدکننده با نام اگزون(۲۶) و نواحی غیرکُدکننده با نام اینترون(۲۷) است. حذف اینترون ها از mRNA برای ساخت mRNA بالغ که قابلیت ترجمه به پروتئین را دارد بسیار ضروری است و به این فرآیند اصطلاحا پیرایش (RNA(۲۸ گفته می شود. بنابراین، فرآیند پیرایش mRNA یکی از عواملی است که سَرهَم سازی توالی های به دست آمده از نسل جدید فناوری های توالی یابی را در یوکاریوت ها دشوارتر از پروکاریوت ها می کند؛ خصوصاً که پروکاریوت ها تقریبا فاقد پروسه پیرایش اند. پس از انجام فرآیند پیرایش در یوکاریوت ها، mRNA برای ترجمه به سیتوپلاسم منتقل می شود. در پروکاریوت ها اما، به دلیل فقدان هسته و سایر اندامک های سلولی، ترجمه mRNA حین فرآیند رونویسی آغاز می شود (۲و۵).
tRNA مسئول انتقال اسیدهای امینه به rRNA و mRNA در خلال فرآیند ترجمه است و زنجیره ای کوچک متشکل از حدود ۸۰ نوکلئوتید دارد. این نوع RNA شامل یک توالی ویژه با نام آنتی کُدون(۲۹) و همچنین دارای موضعی برای اتصال اسید امینه است (شکل ۱-۲ ب). هر tRNA از طریق محل اتصال اسید امینه خود، به طور اختصاصی به اسیدهای امینه خاص متصل شده و بدین ترتیب، این اسیدهای امینه را برای افزوده شدن به پروتئینِ در حال ساخت منتقل می کند. توالی هر سه نوکلئوتید در mRNA مُعرف یک کُدون است که به یک اسید امینه خاص تعلق دارد. ناحیه آنتی کُدون tRNA مُعرف توالی مکمل این سه نوکلئوتید است. موقعیت اسید امینه در پروتئینِ در حال ترجمه به وسیله آنتی کُدون tRNA که رابطه مکملی با کُدون mRNA دارد مشخص می شود (۲). کُدون mRNA و آنتی کُدون tRNA از طریق پیوند هیدروژنی به هم متصل می شوند و به اسیدهای امینه اجازه می دهند تا میان یکدیگر پیوند پپتیدی ایجاد کنند. این امر سبب می شود که زنجیره پُلی پپتیدی (پروتئینِ ترجمه شده) رشد کند. به RNA ناقلی که به اسیدهای امینه متصل شده است اصطلاحاً RNA ناقل دارای بار(۳۰) یا RNA ناقل امینواَسیله شده(۳۱) گفته می شود، در حالی که tRNA فاقد اسید امینه با نام tRNA بدون بار(۳۲) شناخته می شود (۴و۵).
RNA ریبوزومی در هسته شکل گرفته و سپس به سیتوپلاسم فرستاده می شود تا به mRNA متصل شود و فرآیند ترجمه به پروتئین انجام پذیرد (شکل ۲-۱ پ). ریبوزوم ها می توانند در آنِ واحد به چندین mRNA متصل شوند. RNA های ریبوزومی فراوان ترین نوع RNA هستند و حدود
۸۰ درصد کل RNA های استخراج شده از یک سلول یوکاریوتی تیپیک را به خود اختصاص می دهند (۵ و ۷).
درباره سایر انواع RNA، جدول ۲-۱ نمونه های مختلف این ساختارها را، که کارکردهایی غیر از سنتز پروتئین، همچون اصلاحات پس از رونویسی و یا عملیات تنظیمی را بر عهده دارند، معرفی می کند.

۳ -۱-۱: پروتئین ها

پروتئین ها از ترجمه mRNA حاصل شده و بخش چشمگیری از ساختارهای داخلی سلول های زنده را به خود اختصاص می دهند. تقریبا تمامی عملکردهای ساختاری، کاربردی و تنظیمی در سلول، در نتیجه عمل پروتئین ها صورت می پذیرد. یک پروتئین زنجیره ای از اسیدهای امینه است که با پیوند شیمیایی به نام پیوند پپتیدی یا پیوند آمیدی به هم متصل شده اند. هر اسید امینه از یک اتم کربن مرکزی، یک اتم هیدروژن، یک گروه آمینو (NH۲)، یک گروه کربوکسیل (COOH) و یک زنجیره کناری تشکیل شده است. این زنجیره کناری عامل تفاوت ۲۰ اسید امینه ای است که به صورت طبیعی وجود دارند. پیوند پپتیدی بین گروه کربوکسیل یک اسید امینه و گروه آمینوی اسید امینه دیگر شکل گرفته و در نتیجه آن یک مولکول آب آزاد می شود. در خلال فرآیند ترجمه، اسیدهای امینه به همان ترتیبی که در اطلاعات ژنتیکی کُدگذاری شده اند در کنار هم قرار می گیرند و پیوند پپتیدی بین آنها ایجاد می شود و بدین طریق پروتئین ساخته می شود. یک زنجیره کوتاه از اسیدهای امینه با نام پپتید و هرکدام از اسیدهای امینه با عنوان زیرواحد شناخته می شوند. بنابراین، یک پروتئین با ۲۰۰ اسید امینه را می توان به صورت زنجیره ای پلی پپتیدی با ۲۰۰ زیر واحد نیز معرفی کرد (۲و۷).

جدول ۲-۱: مثال هایی از RNA های دخیل در تغییرات پس از رونویسی و فعالیت های تنظیمی



R= regulatory RNA PTM=Posttranscriptional modification RNA

همان طور که DNA و RNA دارای دو جهت اند ۵ و ´۳)، پروتئین نیز چنین حالتی دارد و یک سوی آن همیشه به گروه آمینو می رسد و انتهای دیگرش به گروه کربوکسیل. انتهای دارای گروه امینو را انتهای (N (۳۳ و انتهای دارای گروه کربوکسیل را انتهای (C (۳۴ می نامند. اتم های نیتروژن، کربن و گروه CO-، اسکلت پروتئین را تشکیل می دهند که مانند خطی از انتهای N آغاز و به انتهای C ختم می شود. برخلاف DNA و RNA پروتئین ها فقط رشته های خطیِ توالی ها نیستند. در حقیقت توالی پروتئین (یعنی ردیفی از اسیدهای امینه) معرف ساختار اولیه(۳۵) پروتئین است. برهم کُنش بین اتم های موجود در اسکلت مورد اشاره موجب ایجاد ساختاری موضعی می شود که به عنوان ساختار دوم پروتئین شناخته می شود. یک لایه اضافی که در نتیجه پیچ و تاب خوردن(۳۶) پروتئین ایجاد می شود، موجب به وجود آمدن ساختار سه بعدی منحصر به فردی می شود که به نام ساختار سوم پروتئین معروف است. به همین روال، مرحله دیگری از فشرده شدن پروتئین ها و یا مجموعه ای از چندین پروتئین، ساختار چهارم پروتئین را ایجاد می کند (۲و۷).



شکل ۲-۱: انواع RNA و فرآیند ترجمه. (الف) RNA پیامبر (mRNA). (ب) RNA ناقل (tRNA). (پ) RNA ریبوزومی (rRNA).

نظرات کاربران درباره کتاب نسل جدید فناوری‌های توالی‌یابی و چالش‌های سرهم‌سازی توالی‌ها