-
تعیین توالی DNAاز مهم ترین روش ها در زیست شناسی است که توسط آن می توان ترتیب قرار گرفتن نوکلیوتیدها را در یک قطعه از DNA مشخص کرد. چندین روش متفاوت در تعیین توالی DNA وجود دارد که روش های قدیمی تر، مانند روش Sanger زمان بر و پرهزینه است و لذا محققان برای کاهش هزینه های توالی یابی و توان عملکردی بالا روش های جدیدتر توالی یابی را ابداع کرده اند؛ امروزه توالی یابی را می توان به سه نسل تقسیم بندی کرد. روش های نسل جدید قادر به توالی یابی سریع و همزمان قطعات بزرگ DNAاست. به کمک روش های نسل جدید می توان توالی یابی کل ژنوم، توالی یابی مناطق هدف، تعیین توالی از نو و سر هم بندی، تعیین توالی RNA و تغییرات وراژنتیکی را بررسی کرد. با توجه به اینکه هر روش از توالی یابی نسل جدید معایب و مزایایی دارند، از این رو مهم ترین امر در زمینه روش های توالی یابی این است که محققین بر اساس ویژگی های طرح پژوهشی خود، مناسب ترین روش توالی یابی را از نظر کارایی انتخاب کنند.کلید واژگان: تعیین توالی DNA, نسل بعدی توالی یابی, روش Sanger, روش Maxam-Gilbert, توالی یابی موازی بزرگ, توالی یابی تک مولکولDNA sequencing is one of the most important techniques in biology which determine precise order of nucleotides within a DNA molecule. Old methods such as Sanger DNA sequencing, are time laboring and expensive methods. Therefore, researchers developed next generation sequencing (NGS) which are more economical and high-throughput methods comparing with old methods. NGS methods classified into three main generations. These methods are able to fast sequencing of long fragments of DNA. By means of NGS, whole genome sequencing, target specific sequencing, de-novo sequencing and assembly, RNA sequencing and investigation of genetically changes are possible. it's so important to consider befits and defects of each method, and choosing a suitable NGS method due to properties of research program.
-
نسل جدید روش های توالی یابی و کاربردهای آنتوالی یابی DNA یک روش آزمایشگاهی است که برای تعیین توالی یک مولکول DNA استفاده می شود و خود شامل هر روش یا تکنولوژی می باشد که برای تعیین ترتیب چهار باز آدنین، گوانین، سیتوزین و تیمین در یک رشته ی DNA به کار برده می شود. توالی یابی DNA، ممکن است برای تعیین توالی ژن های ویژه، مناطق بزرگ ژنومی، کل کروموزوم و کل ژنوم به کار برده شود. امروزه، با پیشرفت های قابل ملاحظه ای که در بیولوژی مولکولی به وجود آمده است، روش های سنتی توالی یابی (به طور عمده تکنیک Sanger) که زمان بر و گران می باشند، دیگر پاسخگوی نیاز محققان نیستند. در نتیجه، افزایش تقاضا برای کاهش هزینه ی توالی یابی، به توسعه ی تکنولوژی های توالی یابی با توان عملکردی بالا (نسل جدید توالی یابی) منجر شد که قادر به توالی یابی هزاران و یا میلیون ها توالی به صورت هم زمان می باشد. نسل جدید توالی یابی، قادر به توالی یابی سریع قطعات بزرگ DNA در طول ژنوم است و با حداقل ابزارها، قادر به تولید گیگا باز داده در هر مرحله ی توالی یابی می باشد. روش های نسل جدید توالی یابی، طیف وسیعی از کاربردها نظیر توالی یابی کل ژنوم، توالی یابی از نو، توالی یابی RNA برای کاربردهایی مثل بررسی ترانسکریپتوم و RNAهای کوچک، بررسی متیلاسیون و بررسی برهم کنش نوکلئیک اسید و پروتئین را شامل می شوند.کلید واژگان: توالی یابی, نسل جدید توالی یابی, تکنولوژی 454, تکنولوژی Solex, Sequencing by oligonucleotide ligation and detectionNext-Generation Sequencing and its ApplicationsDNA sequencing is an approach exploited to determine the sequence of a DNA molecule. It includes any method or technology used to identify and determine the order of the four bases of adenine, guanine, cytosine, and thymine in a strand of DNA. DNA sequencing might be used to determine the sequence of individual genes, larger genetic regions, full chromosomes, or entire genomes. Traditional sequencing methods are mainly based on the original Sanger sequencing technique which makes them very expensive and low-throughput; thus, they do not meet the needs of researchers. Consequently, with the considerable advances in molecular biology and the high demand for low-cost sequencing has encouraged the development of high-throughput sequencing (or next-generation sequencing) technologies that parallelize the sequencing process, producing thousands or millions of sequences concurrently. Next-generation sequencing enable us to rapidly sequence a large piece of DNA which could span the whole genome with the latest instruments capable of producing gigabases of data in one isolated sequencing run. Next-generation sequencing platforms have a wide variety of applications, such as whole-genome sequencing, de novo sequencing, RNA sequencing (for applications such as transcriptomics and small RNA analysis), methylation analysis, and protein-nucleic acid interaction analysis.Keywords: Sequencing, Next, generation sequencing, 454, Solex, Sequencing by oligonucleotide ligation, detection (SOLiD)
-
حذف و درج (ایندل) یکی از اجزای اصلی تنوع ژنتیکی و فنوتیپی است که نسبت به چند ریختی های تک نوکلئوتیدی و تنوع های ساختاری کمتر مورد توجه قرار گرفته است. به منظور شناسایی ایندل های موجود در ژنوم سگ و گرگ ایرانی و ارزیابی گروه های عملکردی مرتبط با آن ها، 5/287 گیگابایت داده حاصل از توالی یابی کل ژنوم شش قلاده سگ (دو سگ تازی از استان کردستان و یک سگ قهدریجانی از استان اصفهان) و گرگ (از استان های تهران، همدان و کرمان) با میانگین عمق پوشش X 16 و درصد همپوشانی 47/99 با ژنوم مرجع سگ آنالیز شد. در این تحقیق برای افزایش دقت و صحت ایندل های شناسایی شده، از الگوریتم قدرتمند شناسایی واریانت (HaplotypeCaller) استفاده شد. بیش از سه میلیون ایندل (باز 1-73) حاصل شد. اکثر ایندل ها (18/95 درصد) کوچک تر از 10 باز بودند. مقایسه نتایج مستند سازی ایندل های ژنوم در سگ و گرگ نشان داد که درصد ایندل های ژنوم در نواحی اگزون و ناحیه غیر قابل ترجمه (RNA utr ʹ3) در سگ بیش تر از گرگ است. بنابراین فرآیند اهلی سازی احتمالا سبب افزایش تنوع ژنتیکی در نواحی اگزون و ناحیه غیر قابل ترجمه RNA (utrʹ3) شده است.کلید واژگان: اهلی سازی سگ, ایندل, ژن آنتولوژی, گروه های عملکردیInsertions and deletions (INDELs) are one of the main events contributing to genetic and phenotypic diversity, which have received less attention than SNPs and large structural variations. A total of 287.5 GB of data resulting from whole genome sequencing of six dog and wolf genomes with mean depth and coverage (percentage of mapping to genome reference) of 16X and 99.47, respectively, were analyzed to detect INDELs and assessment of their related functional groups, More than three million INDELs (1-73 bp) were detected. In this study, powerful algorithm (HaplotypeCaller) was used to increase precision and accuracy of detected INDELs. Most of the INDELs (95.179.9%) were smaller than 10bp. Results of INDELs annotation showed that the percentage of INDELs in exon and 3´ utr regions in dog genome was more than that in wolf genome, indicating that the domestication process has targeted the genomic variation in the exon and utr'3 regions.
-
سندرم کاهش تولید تخم مرغ (EDS) در اکثر کشورهای دنیا به طور فراگیر در طیور صنعتی شایع است. این بیماری توسط آتادناویروس اردک A و یا ویروس EDS (EDSV) ایجاد می شود که عضوی از جنس آتادناویروس و خانواده آدنوویریده است. بیماری مرتبط با خسارات اقتصادی قابل توجه در صنعت طیور تجاری در سراسر دنیا بدلیل کاهش تولید تخم مرغ، کاهش کیفیت تخم مرغ و عدم رسیدن به پیک تولید می باشد. واکسن های کشته با ادجوانت روغنی عمدتا در طیور صنعتی استفاده می شوند و حفاظت خوبی را دربرابر EDS ایجاد می کنند. در این مطالعه، EDSV آداپته شده در تخم مرغ جنین دار مورد آنالیز ژنتیک و فیلوژنتیک قرار گرفت. پس از استخراج DNA ویروسی از مایع آلانتوییک تخم مرغ جنین دار آلوده، بااستفاده از 25 جفت پرایمر کل توالی ژنوم ویروسی توسط PCR تکثیر گردید. پس از تخلیص محصولات PCR، آمپلیکون ها مورد توالی یابی کل ژنومی بااستفاده از توالی یابی نسل بعدی (NGS) قرار گرفتند. همولوژی نوکلیوتیدی مشاهده شده بین ژنوم های سویه مورد مطالعه و سویه اصلی 127 مرغان تخم گذار (NC_001813) 9/99 درصد بود. ژنوم این سویه دارای طول 33213 نوکلیوتیدی با محتویات G+C 01/43 درصد بود. درمقایسه توالی ژنومی ویروس مورد مطالعه با سویه 127، تنها 3 پلی مورفیسم تک نوکلیوتیدی (SNP) بین این توالی های ژنومی ویروسی یافت شد. از این SNP ها، موتاسیون S320G و I62K در مناطق کدکننده پروتیین های فیبر و فرضی مشاهده شد که ممکن است در آداپتاسیون EDSV در تخم مرغ جنین دار نقش بازی کند. توالی یابی کل ژنوم EDSV بااستفاده از روش NGS اطلاعات جامعی در کشف واریانت های ژنتیکی ارایه می دهد. بعلاوه، اطلاعات توالی ژنومی EDSV فراهم کننده اطلاعات ارزشمند برای تولید واکسن در آینده نزدیک است.Egg drop syndrome (EDS) is prevalent in industrial poultry globally. This disease is caused by Duck atadenovirus A or EDS virus (EDSV), a member of the genus Atadenovirus under the family Adenoviridae. The disease is attributed to significant economic losses in the poultry industry worldwide due to a drop in egg production, reduction in egg quality, and failure to reach maximum egg production. Oil‐adjuvant inactivated vaccines, which are widely used in the poultry industry, provide good protection for immunized chickens against EDS. This study aimed to genetically and phylogenetically analyze the full-length genome of an embryonated chicken egg-adapted EDSV strain 127. After extraction of viral DNA from the allantoic fluid, overlapping fragments of the viral genome sequence were generated by polymerase chain reaction (PCR) using 25 pairs of primers. Purified PCR products were subjected to complete genome sequencing by the next-generation sequencing (NGS) approach. The nucleotide homology observed between genomes of the studied strain and that of the original strain 127 (NC_001813) of laying chickens was 99.9%. Its genome was 33,213 bp in length, with a G + C content of 43.01%. A comparison of the genome sequence of the egg-adapted virus with strain 127 revealed only three non-synonymous single-nucleotide polymorphisms (SNPs) between these viral genome sequences. Two mutations of S320G and I62K out of these SNPs were found within the coding regions of fiber and hypothetical proteins which may play a role in the adaptation of EDSV in the embryonated chicken eggs. The full genome sequencing of EDSV using NGS techniques provides insights into the discovery of genetic variants. Moreover, the genome sequence information of the EDSV provides valuable data for vaccine development in near future.Keywords: Duck atadenovirus A, egg drop syndrome, egg-adapted virus, Molecular Characterization, Next Generation Sequencing
-
مطالعات تنوع ژنتیکی و بررسی میزان همخونی در جمعیت های شتر امری ضروری و همچنین، گام اولیه برای طراحی برنامه های اصلاح نژادی در این گونه محسوب می شود. در این راستا، ابزارهای قدرتمندی مانند توالی یابی نسل بعد، امکان رمزگشایی اطلاعات کل ژنوم در این گونه را فراهم نموده است. با این انگیزه تحقیقاتی، هدف از پژوهش حاضر، شناسایی رشته های هموزیگوت ژنومی و بررسی ژن های مرتبط در شترهای تک کوهانه با استفاده از داده های توالی یابی کل ژنوم می باشد. بدین منظور، در مجموع از 12 داده ژنوم توالی یابی شده مربوط به شترهای ایرانی و غیرایرانی استفاده شد. پس از طی مسیر تجزیه و تحلیل بیوانفورماتیکی شامل تعیین کیفیت، پیش پردازش داده، همترازی در ژنوم مرجع، شناسایی واریانت ها، فیلتر کیفی واریانت ها، در نهایت شناسایی نواحی ROH صورت پذیرفت. نتایج پژوهش حاضر منجر به شناسایی 549 (3/137 ناحیه به ازای هر نمونه) و 1356 (5/169 ناحیه به ازای هر نمونه) رشته هموزیگوت به ترتیب در ژنوم شترهای ایرانی و شترهای شبه جزیره عربستان گردید. نتایج حاصل از حاشیه نویس (annotation)، حضور ژن های مهم مرتبط با صفات باروری مانند FSHR و LHCGR در داخل رشته های هموزیگوت شترهای تک کوهانه ایرانی را نشان داد. همچنین، تجزیه و تحلیل بیوانفورماتیکی هستی شناسی در مناطق رشته های هموزیگوت ژنومی شناسایی شده، حضور ژن های مهمی مانند CXCL9)، CXCL10، CXCL11 (مرتبط با عملکرد سیستم ایمنی)، (STBD1) (مرتبط با متابولیسم انرژی)، SCARB2) مرتبط با متابولیسم چربی و باروری) و SHROOM3) مرتبط با عملکرد سیستم کلیوی) بین هر دو جمعیت شترهای ایرانی و غیرایرانی را نشان داد. در نهایت، بعنوان جمع بندی به نظر می رسد عامل کنترل و پیدایش رشته های هموزیگوت در ژنوم شترها، انتخاب طبیعی برای سازگاری با محیط بیابان می باشد.
کلید واژگان: داده های ژنومی, شتر, توالی یابی نسل بعدessential, as well as, the first step for designing breeding programs in this species. In this regard, powerful tools such as next-generation sequencing technology have made it possible to decode the genome information in this species. Based on this research motive, the aim of the current study was to identify the genomic runs of homozygosity (ROH) and investigate related genes in dromedary camels using whole genome sequencing data. For this purpose, a total of 12 sequenced genomic data related to Iranian and non-Iranian dromedary camels were used. After bioinformatics analysis including quality assessment, data pre-preprocessing, alignment in the reference genome, and identification of variants, qualitative filter of variants, finally, ROH regions were identified. Based on the obtained results, 549 (137.3 regions per sample) and 1356 (169.5 regions per sample) ROH were identified in the genomes of Iranian dromedary camels and dromedaries from the Arabian Peninsula, respectively. The results of the annotation revealed that some important fertility-related genes such as FSHR and LHCGR are located in the ROH regions of Iranian dromedary camels. Also, investigation of gene ontology results revealed that some important genes including CXCL9, CXCL10 and CXCL11 (immune-related), STBD1 (related to energy metabolism), SCARB2 (related to lipid metabolism and fertility) and SHROOM3 (related to kidney function) are shared between Iranian and non-Iranian camels. Finally, as a summary, it seems that the controlling factor and the reason for the creation of ROHs in the genome of dromedary camels is natural selection to adapt to the desert environment.
Keywords: Genomic data, Camel, Next-generation sequencing -
استخراج DNA بصورت خالص، پایدار و با کمیت و کیفیت مناسب، گام مهمی در اجرای پژوهش های بیولوژیکی می باشد. در این تحقیق، DNA مربوط به نمونه خون 600 بلدرچین ژاپنی با روش نمکی تغییر یافته با پودر رختشویی و بدون استفاده از آنزیم پروتئیناز K استخراج شد. نمونه های DNA بدست آمده در مراحل آماده سازی کتابخانه ژنومی، با نانودراپ، فلئورومتر، بیوآنالیزر، الکتروفورز، PCR، هضم با آنزیم های آندونوکلئاز، اتصال برچسب و آدابتور و در نهایت با توالی یابی کل ژنوم کنترل کمی و کیفی گردید. متوسط مقدار DNA استخراج شده با متوسط میزان نسبت جذب نور در 26 به 280 نانومتر برای هر نمونه به ترتیب 138 میکروگرم و 87/1 بود. فرآیند های تکثیر، هضم، اتصال برچسب و آدابتور و توالی یابی ژنومی همه نمونه های DNA مورد استفاده با موفقیت کامل همراه بود. بر اساس نتایج مشخص شد که نمونه-های مذکور از کمیت، کیفیت، قابلیت و پایداری لازم و حداقل آلودگی برخوردار بودند. این روش استخراج DNA به سادگی، سریع، ایمن و با حداقل هزینه انجام پذیر است.
کلید واژگان: ارزیابی DNA, پودر رختشویی و توالی یابی چندگانه -
تعیین جنسیت ماهیان خاویاری یکی از مهم ترین و جذاب ترین موضوعات پیش روی محققین شیلاتی و همچنین آبزی پروران این حوضه بوده است. تعیین جنسیت مولکولی این ماهیان با استفاده از روش های سنتی مرسوم تا کنون نتایج مثبتی را در بر نداشته است در صورتیکه با بوجود آمدن تکنیک های جدید توالی یابی موسوم به NGS، امکان ردیابی و کشف نواحی ژنومی تمایز دهنده جنسیت فراهم گردیده است. بر همین اساس و با استفاده از روش توالی یابی کل ژنوم در دو مطالعه مجزا، نواحی ژنتیکی مرتبط با جنسیت شناسایی گردید. مقاله حاضر ضمن مروری بر مطالعات انجام شده بر روی تعیین جنسیت ماهیان خاویاری، لیست نشانگرهای قابل استفاده در تعیین جنسیت گونه های مختلف این ماهیان را جهت استفاده بهره برداران و ارتقای صنعت آبزی پروری ماهیان خاویاری در اختیار قرار می دهد. همچنین با توجه به نتایج دقیق و صحت بالای آزمایشات مولکولی و از سویی عدم آسیب رسانی به ماهی هنگام نمونه برداری، پیشنهاد می گردد از اطلاعات مولکولی در تشخیص جنسیت این ماهیان به عنوان روش جدید استفاده گردد.
کلید واژگان: تعیین جنسیت, ژنومیکس کاربردی, کروموزوم جنسی, ماهیان خاویاری, نشانگر مولکولیSex determination of sturgeons is one of the most appealing subjects towards both fisheries researchers and fish farmers. Molecular sex identification of these fishes using traditional methods have not had positive results, while due to the new advanced genome sequencing approaches known as NGS, it is now possible to detect and track the sexually divergent regions. Hence, based on the whole genome sequencing approach in two distinct studies, genomic regions harboring sex information in sturgeons were characterized and confirmed the ZZ/ZW sex-determination system in sturgeons. The presence of different sex-specific sequences in sturgeons indicates the presence of different sex-specific genomic regions for sturgeons. In the present paper, in addition to review the conducted studies on sturgeon’s sex identification, an applicable list of newly found genetic markers in sex determination of sturgeons are presented towards the beneficiaries and to improve the aquaculture industry of sturgeons. Furthermore, considering the high-quality results obtained by molecular tools in one hand and non-invasive feature of this method during sampling on the other hand, the usage of new universal markers namely AllWsex2 and SM4 is highly suggested as a novel technique in sturgeons’ sex determination in replace of traditional approaches such as ultrasonography and laparoscopy.
Keywords: Functional Genomics, Molecular Marker, Sex Determination, Sex Chromosome, Sturgeons -
شناسایی تنوعات ساختاری مسئول تفاوتهای فنوتیپی در حیوانات اهلی از نظر اقتصادی اهمیت ویژه ای دارد. یکی از دقیق ترین و جدیدترین رویکردهای مورد استفاده در شناسایی این تنوعات، استفاده از تکنیک های توالی یابی نسل جدید است. در پژوهش حاضر، ژنوم مرغ بومی فارس به منظور شناسایی چندشکلی های تک نوکلئوتیدی و حذف و اضافه های کوتاه، با استفاده از داده های توالی یابی کل ژنوم مورد بررسی قرار گرفت. نمونه های مورد بررسی توسط سیستم توالی یابی شرکت ایلومینا (Hiseq 2000) مورد تعیین توالی قرار گرفت. پس از بررسی کیفیت داده ها توسط نرم افزار FastQC، همردیفی توالی های کوتاه با ژنوم مرجع با برنامه BWA انجام و سپس چند ریختی های تک نوکلئوتیدی و حذف و اضافه های کوچک به کمک برنامه GATK مشخص شدند. درصد همردیفی توالی های کوتاه با ژنوم مرجع بالای 99 درصد بود. در این مطالعه 8858153 چند ریختی تک نوکلئوتیدی و 895378 حذف و اضافه کوچک بدست آمد که کمترین مقدار آن در ناحیه اگزونی مشاهده شد. نتایج نشان داد چندریختی های تک نوکلئوتیدی هتروزیگوس فراوانی بیشتری نسبت به چند ریختی های هموزیگوس دارند که این نشان دهنده تنوع زیاد جمعیت مورد بررسی است. همچنین باتوجه به پیشینه چند هزارساله اهلی شدن مرغ در ایران، می توان انتظار داشت که تطابق پذیری با محیط در جمعیت مورد مطالعه اتفاق افتاده باشد و در نتیجه، تغییرات ژنومی در جهت سازگاری با محیط باعث ایجاد تنوع در جمعیت شده است.کلید واژگان: توالی یابی ژنوم, چندریختی های تک نوکلئوتیدی, حذف و اضافه کوچک, تنوع جمعیتOne of the most important approaches in animal breeding is identification of structural variations responsible for economical important traits. Next generation sequencing technologies are provided accurate tools for this purpose. In the present study, Fars province native poultry genome was analyzed using genome sequencing approach. Paired-end sequencing of the whole genome was conducted by Illumina Company in China. Data quality was determined by FastQC software. Short reads of sequences were mapped with the reference genome with the BWA program. Single nucleotide polymorphisms and small deletions and insertions were identified with the GATK program. The short sequences were compared with the reference genome of over 99% and with the mean depth of the X8 coverage. In this study, 8858153 single nucleotide polymorphisms and 895378 small deletions and insertions were identified with the lowest counts in the exon region. Since the results of identifying the variants showed that the most frequent variant is related to single nucleotide polynomials¡ in this study, heterozygous loci were higher than homozygous loci indicating the high diversity of the population under study. Given the history of several thousand years of chicken domestication in Iran, one can expect that adaptation to the environment has occurred in the population studied. As a result of genomic changes in order to adapt to the environment, it has created a diversity in the population.Keywords: Next Generation Sequencing, SNP, InDels, Population variation
-
شترهای دوکوهانه یکی از مقاومترین گونه های حیوانی در برابر شرایط سخت محیطی به شمار می روند که تعداد آنها در ایران در محدوده خطر قرار گرفته است. شناخت هر چه بهتر و دقیق تر این گونه، به خصوص در سطح مطالعات ژنومی، می تواند از طریق طراحی برنامه های مدیریت تنوع ژنتیکی، به حفظ این گونه کمک کند. هدف از انجام این مطالعه شناسایی ریزماهواره های ژنوم شترهای دوکوهانه ایرانی با استفاده از داده های توالی یابی کل ژنوم بود. در مطالعه حاضر از تعداد شش نفر شتر دوکوهانه متعلق به استان اردبیل خون گیری صورت گرفت. توالی یابی کامل ژنوم شترهای دوکوهانه با استفاده از پلتفرم ایلومینا و به صورت دو انتها (Paired-end) با اندازه 100 جفت باز از هر طرف انجام شد. بعد از پالایش کیفی خوانش ها، گردآوری از نو آنها صورت گرفته و با استفاده از برنامه MISA به شناسایی تمام ریزماهواره های ژنوم های مورد مطالعه پرداخته شد. اندازه ژنوم های گردآوری شده برای شترهای دو کوهانه مورد مطالعه، در محدوده Gb 90/1 برای نمونه یک تا Gb 97/1 برای نمونه سه قرار داشت. مقدار N50 مربوط به کانتیگ های ایجاد شده برای شترهای دو کوهانه ایرانی از kb 1/19 برای نمونه یک تا kb 7/51 برای نمونه پنج متغیر بود. ریزماهواره های شناسایی شده در اندازه یک تا هشت نوکلیوتید بودند. کل ریزماهواره های شناسایی شده برای نمونه های شترهای دو کوهانه ایرانی در محدوده 136028 برای نمونه دو تا 539555 برای نمونه سه قرار داشت. همچنین با شناسایی ریزماهواره های هفت گونه پستاندار دیگر در این مطالعه، به مقایسه نتایج به دست آمده آنها با شتر دوکوهانه ایرانی پرداخته شد.
کلید واژگان: ایران, توالی یابی کل ژنوم, ریزماهواره, شتر دو کوهانهIntroductionBactrian camels are known as one of the resistant species to harsh environmental conditions. The camel’s body temperature may vary from 34 to 41 °C throughout the day. They can survive if they lose body water greater than 25% of total body weight, while, in non-desert mammals, losses of greater than 15% are deadly. Since, Iran is located in one of the most arid regions of the world and water resources shortage, also special capabilities of camels, this species can be a valuable source of protein in the country. The study of genetic diversity is one of the most widely studies in domestic animals and microsatellites are widely used in this field. Microsatellite sequences contain useful information and are widely used to assess genetic diversity within and between populations, as well as to investigate the evolution process between species. The main aim of the present study was to identify the total microsatellites in the genome of Iranian Bactrian camels using whole genome sequencing data and compare them with other mammalians.
Materials and MethodsThis study was carried out to identify genome wide microsatellites on six Bactrian camels from Ardabil province. Blood samples were collected from the jugular vein using 4 ml vacutainer tubes and stored at -20C˚ until use. Illumina HiSeq 2000 technology (Illumina, USA) was used for whole genome sequencing of samples. Sequencing was performed using the paired-end method with 100 bp at both ends of the reads. The quality control of raw sequence reads was performed using FastQC software. The SLIDINGWINDOW (4:20) algorithm of Trimmomatic v0.36 program was used to quality filter of raw reads. After filtration of reads with low quality, reads shorter than 40 bp were discarded. The de novo assembly of trimmed reads from Bactrian camels was done using CLC Genomics Workbench 11 software (CLC Bio, Aarhus, Denmark). The parameters used in this study for de novo assembly of trimmed reads were: 3 for mismatch cost, 3 for deletion and insertion cost, 0.5 for length fraction, and 0.8 for similarity fraction. Assembled genomes were searched for identifying the microsatellites using MISA with motif size ranging from mono-nucleotide to octo-nucleotide. The minimum repeat numbers were defined as 12 for mono-, 6 for di-, 5 for tri- and tetra, 4 for penta- and hexa-, and 3 for hepta- and octo-nucleotide repeat SSRs. Microsatellite motifs that interrupted by 100 nucleotides were considered as compound microsatellites. Also, several mammalians assembled genomes were downloaded and searched for microsatellite loci, including Arabian dromedary camel, Bactrian camel, alpaca, horse, cattle, sheep, and human.
Results and DiscussionThe assembled genome size for the Bactrian camels were ranged from 1.90 for sample one to 1.97 for sample three. Also, the N50 length for the assembled contigs of Iranian Bactrian camels were ranged from 19.1 kb for sample one to 51.5 kb for sample five. The contig N50 length is one of the qualitative measurement parameters of genome assembly and a larger size means better assembly.The total microsatellites loci identified for Iranian Bactrian camels ranged from 136028 for sample two to 539555 for sample three. The results show that the genome of samples one, two, three, four, five and six contained 3.13 Mb, 2.35 Mb, 9.26 Mb, 7.1 Mb, 8.99 Mb and 8.86 Mb microsatellites, respectively. It should be noted that the difference in the microsatellites of SSRs in the Iranian Bactrian camel genomes is due to their different qualities in assembly. In mammals examined in this study, humans with 25.7 Mb and horses with 7.81 Mb had the highest and lowest total size of microsatellites, respectively. The results revealed that the number of microsatellites decreases with increasing in them, repeats, so that, one and two repeats sequences are the most frequent motifs. More than 74% of the identified microsatellites belong to the ten microsatellites with the highest number in all seven species. The motif T is the most frequent motif in the samples one and six Iranian Bactrian camels, Iranian dromedary camels, Bactrian camel, cattle, sheep, horses and humans. In samples two, three, four, five, the non-Iranian dromedary camel and alpaca motif A is the most abundant motif. The finding of this study will be applied as a valuable resource for further studies on camel breeding, especially on Iranian Bactrian camels. A large number of camel’s SSR markers developed in this study established a valuable resource for the investigation of genetic diversity and may improve the development of breeding programs in Iranian Bactrian camels in the future.
Keywords: Bactrian camel, Iran, Microsatellite, Whole genome sequencing -
مطالعه حاضر، اولین پژوهش برای شناسایی واریانت های ژنتیکی در لاین آرین با اطلاعات توالی یابی کل ژنوم است. مطالعه خصوصیات لاین آرین در سطح ژنوم، می تواند تفاوت های ژنتیکی آن را در ارتباط صفات مهم اقتصادی از جمله رشد شرح دهد. در این پژوهش، از اطلاعات توالی کل ژنوم سه قطعه مرغ آرین استفاده شد. نتایج نشان داد که 63866 واریانت بین نمونه ها مشترک است که از این تعداد، 17604 واریانت به عنوان واریانت جدید برای اولین بار در این پژوهش گزارش شدند. همچنین، 604 واریانت در مناطق کدکننده ژنوم وجود دارند که از این تعداد، 204 واریانت منجر به تغییر در نوع آمینواسیدی پروتئین ها می گردند. با توجه به مهم بودن کیفیت پروتئین جیره برای رشد و افزایش وزن برای طیور، نتایج ژن آنتولوژی نشان داد که مسیر کاتابولیسم پروتئین ها و مسیرهای تغییرات پس از ترجمه ی پروتئین های مرتبط با رشد دارای اهمیتی دوچندان هستند. همچنین، ژن های کاندیدایSMURF2 و SUMO1 برای این مسیرهای بیولوژیک پیشنهاد شد. یکی دیگر از نتایج قابل توجه ژن آنتولوژی، معنی دار شدن مسیرهای پاسخ به تنش بود. در لاین آرین به دلیل انتخاب شدید برای دستیابی به پیشرفت ژنتیکی بالا در صفات رشد، وجود تنش اجتناب ناپذیر است. بنابراین، معنی دار شدن مسیرهای پاسخ به تنش، می تواند نشان دهنده اهمیت این مسیرها در ارتباط با عملکرد مطلوب باشد.کلید واژگان: لاین آرین, توالی یابی کل ژنوم, واریانتThis is the first study for discovering genetic variants in Arian line by whole genome sequencing data. The study of Arian line features at genomic level can unravel the genetic background of economic traits such as growth. In this study, the information of three whole genomes of Arian chickens were used. The results of this study indicated that, there were 63866 common variants among samples. 17604 variants Out of 63866 variants were reported as novel variants in this study. Also 604 variants are located in coding regions, which 204 out of them lead to change in the amino acid sequence of the proteins. Considering the importance of dietary protein quality for growth and weight gain for poultry, the results of gene ontology analysis indicated that the pathways of protein catabolism and post-translational modification of proteins, related to growth are considerable. Also candidate genes such as, SMURF2 and SUMO1 was suggested for these biological pathways. Another interesting result of gene ontology was the significance of response to stress pathways. In the Arian line due to intense selection, the existence of stress is inevitable. Therefore, the significance of stress response can indicate the importance of these pathways in relation to the desired performance.Keywords: Arian line, Whole-genome sequencing, Variants
-
از آنجا که گزینه «جستجوی دقیق» غیرفعال است همه کلمات به تنهایی جستجو و سپس با الگوهای استاندارد، رتبهای بر حسب کلمات مورد نظر شما به هر نتیجه اختصاص داده شدهاست.
- نتایج بر اساس میزان ارتباط مرتب شدهاند و انتظار میرود نتایج اولیه به موضوع مورد نظر شما بیشتر نزدیک باشند. تغییر ترتیب نمایش به تاریخ در جستجوی چندکلمه چندان کاربردی نیست!
- جستجوی عادی ابزار سادهای است تا با درج هر کلمه یا عبارت، مرتبط ترین مطلب به شما نمایش دادهشود. اگر هر شرطی برای جستجوی خود در نظر دارید لازم است از جستجوی پیشرفته استفاده کنید. برای نمونه اگر به دنبال نوشتههای نویسنده خاصی هستید، یا میخواهید کلمات فقط در عنوان مطلب جستجو شود یا دوره زمانی خاصی مدنظر شماست حتما از جستجوی پیشرفته استفاده کنید تا نتایج مطلوب را ببینید.
* ممکن است برخی از فیلترهای زیر دربردارنده هیچ نتیجهای نباشند.
-
معتبرحذف فیلتر