کانتیگ
وربست یا کانتیگ (به انگلیسی: Contig) قطعات پیوستهای از توالی دی ان ای است که توسط بازسازی توالی خواندههای یک کروموزوم تولید میشود. در اصل کانتیگ به مانند نقشه ای از دی ان ای کروموزوم است که که نقاطی که قطعات پیوسته با هم همپوشانی دارند را مشخص میکند. بهطور کلی در یک کانتیگ از توالی نوکلئوتایدهای به دست آمده اطمینان داریم.
تعریف
از آن جایی که دی ان ای یک کروموزوم مولکولی طویل است لازم است برای توالی یابی و مطالعه آن، دی ان ای را به قطعات کوچکتر تقسیم کنیم، سپس توالی قسمتهای کوچکتر، خوانده (به انگلیسی: read) را بخوانیم و از کنار هم قرار دادن آنها با توجه به همپوشانیهایی که دارند، توالی دی ان ای اولیه را بیابیم. وربست یا کانتیگ مجموعه ای است از خواندههایی، یا قطعاتی طولانیتر از خواندهها، از دی ان ای که با هم همپوشانی داشته و در کنار یکدیگر یک توالی مشترک از دی ان ای را میسازند.
در توالی یابی پایین به بالا کانتیگ به مجموعه ای از قطعات همپوشان در توالی داده گفته میشود. در توالی بالا به پایین کانتیگ به کلونهای همپوشانی که یک نگاشت از ژن را برای هدایت توالی و بازسازی توالی تشکیل میدهند، اطلاق میشود. هر چند در سالهای اخیر در مقالات مختلف، تعاریف متفاوت و گاهی ناهماهنگ با هم بیان شده، در اینجا به بررسی دو تعریف گفته شده در بالا پرداخته میشود.
تعریف اولیه کانتیگ
در سال ۱۹۸۰ «استادن» بیان کرد: "برای اینکه صحبت دربارهٔ داده به دست آمده از تفنگ ساچمه ای را آسان کنیم کلمه "کانتیگ" را ابداع کردیم. یک کانتیگ مجموعه ای ژلهای خوانده شدهاست که با یکدیگر همپوشانی دارند. تمامی خواندن ژلها به فقط و فقط یک کانتیگ تعلق دارند و هر کانتیگ حداقل شامل یک ژل خوانده شدهاست. مجموعه این خواندهها در یک گانتیگ میتواند یک توالی مشترک ساخته که طول آن برابر با طول کانتیگ است."
توالی گانتیگها
یک توالی کانتیگ یک توالی مداوم است که از بازسازی قطعات کوچک دی ان ای توسط توالی یابی پایین به بالا به حاصل میشوند. این تعریف از کانتیگ با تعریف اولیه «راجر استادن» (۱۹۷۹) مطابقت دارد.توالی یابی پایین به بالا شامل برش دادن ژنوم دی ان ای به قطعات کوچکتر ("خوانده")، توالی یابی این قطعات، بازسازی آنها به کانتیگ و در نهایت به طول کل ژنوم است. از آن جا که فناوریهای اخیر به ما تنها امکان توالی یابی از روی قطعات کوتاه دی ان ای (به طول ۳۰۰ تا ۱۰۰۰ نوکلئوتاید) را میدهند، لازم است که قبل از توالی یابی ژنوم به قطعات کوچک تقسیم شود. در توالی یابی بالا به پایین، دی ان ای تقویت شده به صورت تصادفی به قطعاتی به طول مناسب برای توالی یابی برش داده میشود. خواندههای دنباله دنباله، که توالی قطعات کوچک را شامل میشوند، در یک پایگاه داده درج میشوند. سپس نرمافزار توالی یابی در پایگاه داده به دنبال جفتهای همپوشان میگردد. توالی یابی یه صورت جفت جفت باعث تولید شدن کانتیگهای طولانی تری از دی ان ای میشود. با چندین بار تکرار این مرحله، که در ابتدا شامل قطعات کوتاهتر و به مرور زمان شامل قطعات طولانیتر است، توالی کامل دی ای ان یک کروموزوم قابل تشخیص میشود.
امروزه متداول است که از فناوریهای زوج-انتهایی استفاده شود که دو انتها یک قطعه طولانیتر با یک سایز مشخص توالی یابی میشوند. در اینجا، کانتیگ به هر قطعه پیوسته از دادهٔ توالی یابی که توسط همپوشانی خواندهها تولید شود، گفته میشود. چون طول قطعات دی ان ای را میدانیم، فاصله بین دو انتها در یک قطعه نیز مشخص است. در این صورت اطلاعاتی در مورد جهت دهی کانتیگها داریم که با داشتن آنها میتوان توالی اسکافلدها را بازسازی کرد. هدف اصلی روش تفنگ ساچمه بیان توالی دی ان ای در تنها یک اسکافلد است، اما این هدف همیشه ممکن نیست زیرا بسته به خواندههای به دست آمده، دقت حاصل از توالی یابی میتواند متفاوت باشد.
اسکافلد
اسکافلدها از کانتیگهایی که با فاصلههایی با طول مشخص از هم جدا شدهاند، تشکیل میشوند. محدودیتهای جدیدی که بر روی جهتگیری کانتیگها وجود دارد، امکان قرار دادن توالیهای تکراری در ژنوم را فراهم میکند. اگر یک انتها دارای یک توالی تکراری باشد، تا زمانی که جفت آن درون یک کانتیگ وجود دارد، مکان آن مشخص است. فاصلههای باقی مانده بین کانتیگها در اسکافلدها را میتوان با روشهای گوناگونی، شامل روش تقویتی پی سی آر (برای توالیهای کوتاهتر) و روش کلون بندی کروموزم مصنوعی باکتریایی، توالی یابی کرد.
کانتیگهای روش کروموزوم مصنوعی باکتریایی
کانتیگها همچنین به کلونهای همپوشان در نگاشت یک کروموزوم باکتریایی در روشهای بالا به پایین یا سلسله مراتبی اطلاق میشوند. در این روش، یک نقشه با وضوح پایین قبل از توالی یابی ساخته میشود تا چارچوبی برای هدایت بازسازی توالی ژنوم فراهم شود. این نقشه مکانهای به هم مرتبط و همپوشانی کلونهای یک توالی را مشخص میکند. مجموعهٔ کلونهای همپوشان که یک قطعه پیوسته از دی ان ای را میسازند، کانتیگ نام دارند. حداقل تعداد کلونها برای تشکیل یک کانتیگ که توالی کل یک کروموزوم را تشکیل دهد شامل مسیری از نوکلئوتایدهای توالی است. مادامی که یک مسیر انتخاب شود، مولفههای کروموزوم باکتریایی آن به قطعات کوچکتر برش داده شده و توالی یابی میشوند. در نتیجه کانتیگها چارچوب این توالی یابی سلسله مراتبی را فراهم میکنند. بازسازی یک نقشه کانتیگ شامل مراحل متعددی است. ابتدا، دی ان ای به (۵۰ تا ۲۰۰ هزار) قطعه که کلونها را تشکیل میدهند، تقسیم میشوند. چون این کلونها باید کل ژنوم یا کروموزم را شامل شوند، به صورت تئوری میتوان یک کانتیگ را از کروموزومهای مصنوعی باکتریایی را که کل کروموزوم را میپوشاند، توالی یابی کرد. در واقعیت اما همچین اتفاقی نخواهد افتاد زیرا معمولاً فاصلهها باقی میمانند. همانطور که گفته شد این فواصل را میتوان با روشهای دیگر پوشاند.
ساخت کانتیگهای روش کروموزوم مصنوعی باکتریایی
کانتیگهای کروموزوم مصنوعی باکتریایی از طریق سامان دهی مناطقی در کروموزوم که همپوشانی دارند به دست میآیند. یک روش متداول این است که از نقشه روش توالی-برچسب زده برای تشخیص قطعات یکتا دی ان ای در کروموزومهای مصنوعی باکتریایی مشترک استفاده کرد. درجه همپوشانی توسط تعداد نقاط نشان گذاری شده روش توالی-برچسب زده بین دو کلون به صورت تقریبی به دست میآید، به این صورت که هر چقدر تعداد این نقاط بیشتر باشد، درجه همپوشانی بیشتر است. چون این روش به صورت تقریبی عمل میکند، تجزیه و تحلیل قطعات که اندازهگیری دقیق تر همپوشانی کلونها را فراهم میکند، اغلب مورد استفاده قرار میگیرد. در این استراتژی، کلونها با یک یا دو آنزیم محدود کننده ترکیب و قطعات حاصل با الکتروفورز ژل جداسازی میشوند. از آنجایی که تعداد قطعههای مشترک و طول این قطعات شناخته شدهاست (طول آن با مقایسه با استاندارد اندازهگیری قضاوت میشود)، درجه همپوشانی میتواند با دقت بالایی محاسبه شود.
فواصل بین کانتیگها
فواصل معمولاً بعد از تولید اولیه کروموزوم مصنوعی باکتریایی باقی میمانند. این فواصل زمانی رخ میدهند که کتابخانه کروموزم مصنوعی باکتریایی دارای پیچیدگی کمی باشد، به این معنی که تعداد کمی از توالیهای برچسب زده و محلهای محدود کننده وجود دارد یا بعضی نواحی کمتر در این کتابخانه کمتر حضور دارند. اگر فواصل بین کانتیگها پس از نقشهبرداری روش توالی-برچسب زده و محدودسازی اثر آنها باقی بمانند، توالی انتهای کانتیگها میتوانند برای از بین بردن این فواصل مورد استفاده قرار بگیرند. این روش توالی یابی انتهایی، توالیهای برچسب زدهٔ جدیدی را ایجاد میکند که با استفاده از آن، کانتیگهای دیگر نمایش داده میشوند.
پانویس
- ↑ Gregory, S. Contig Assembly. Encyclopedia of Life Sciences, 2005.
- ↑ Gibson, Greg; Muse, Spencer V. (2009). A Primer of Genome Science (3rd ed.). Sinauer Associates. p. 84. ISBN 978-0-87893-236-8.
- ↑ Dear, P. H. Genome Mapping. Encyclopedia of Life Sciences, 2005. doi:10.1038/npg.els.0005353.
- ↑ What is a Contig? Article in staden.org
- ↑ Staden, R (1980). "A new computer method for the storage and manipulation of DNA gel reading data" (PDF). Nucleic Acids Research. 8 (16): 3673–3694. doi:10.1093/nar/8.16.3673. PMC 324183. PMID 7433103. Retrieved June 7, 2017.
- ↑ Staden R (1979). "A strategy of DNA sequencing employing computer programs". Nucleic Acids Research. 6: 2601–2610. doi:10.1093/nar/6.7.2601. PMC 327874. PMID 461197.
- ↑ Dunham, I. Genome Sequencing. Encyclopedia of Life Sciences, 2005.
- ↑ Fullwood MJ, Wei C, Liu ET, et al. (2009). "Next-generation DNA sequencing of paired-end tags (PET) for transcriptome and genome analyses". Genome Research. 19 (4): 521–532. doi:10.1101/gr.074906.107. PMC 3807531. PMID 19339662.
- ↑ Coulson, A.R; Sulston, J.E; Brenner, S.; Karn, J. (1986). "Toward a physical map of the genome of the nematode Caenorhabditis elegans". Proc Natl Acad Sci U S A.