جستجوی مقالات مرتبط با کلیدواژه "توالی یابی کل ژنوم" در نشریات گروه "بیوتکنولوژی و ژنتیک گیاهی"
تکرار جستجوی کلیدواژه «توالی یابی کل ژنوم» در نشریات گروه «کشاورزی»-
هدف
کشور ایران از جمله قدیمی ترین مراکز اهلی سازی و پرورش گونه های دام و طیور در دنیا محسوب می شود. در حال حاضر، اکوتیپ های مختلفی از گوسفند های بومی در مناطق جغرافیایی مختلف کشور مورد نگهداری قرار می گیرند که به لحاظ ویژگی های ظاهری و تولیدی تفاوت های آشکاری با یکدیگر دارند. تاکنون مطالعه جامعی در سطح کل ژنوم برای شناسایی تنوع ژنتیکی گوسفندان بومی ایران صورت نگرفته است. لذا هدف این مطالعه شناسایی ویژگی های ژنومیکی این ذخایر بومی بمنظور سازماندهی برنامه های مناسب برای بهره برداری و حفاظت از آنها است.
مواد و روش هادر این مطالعه توالی های کل ژنوم 29 راس گوسفند بومی ایران از پایگاه دادهNCBI دانلود و آنالیز شد. توالی یابی کل ژنوم داده های مطالعه شده به صورت Paired-End توسط دستگاه های توالی یاب Hiseq2000 و Hiseq X Ten انجام شده است. کنترل کیفیت توالی داده های خام توسط برنامهFastQC انجام شد. برای همردیفی توالی داده ها با ژنوم مرجع گوسفند از الگوریتم BWA-MEM بکار برده شده در بسته نرم افزاری BWA استفاده شد. برای حذف PCR duplicates از خروجی های همردیفی از برنامه Picard استفاده شد. پردازش خروجی های همردیفی با ژنوم مرجع در دو مرجله شامل همردیفی مجدد حذف و اضافه های کوچک و کالیبره کردن مجدد نمره کیفیت باز با استفاده از برنامه GATK انجام شد. میانگین عمق پوشش و درصد همردیفی برای خروجی همردیفی با ژنوم مرجع با استفاده از دستور های depth و flagstatبه کار برده شده در نرم افزارsamtools محاسبه شد ند. چندریختی های تک نوکلیوتیدی (SNPs) توسط ابزار UnifiedGenotyper بکار رفته در برنامه GATK شناسایی شد ند. مقادیر تنوع نوکلیوتیدی و ضریب همخونی ژنومی بر اساسSNP های هموزیگوت برای هر فرد با استفاده از دستور het به کار رفته در برنامهVCFtools محاسبه شد ند.
نتایجمیانگین عمق پوشش داده های استفاده شده در این مطالعه X 39/18 بود. میانگین درصد همردیفی توالی های کوتاه با ژنوم مرجع گوسفند 89/99 درصد بدست آمد. مقادیر ضریب همخونی ژنومی در نژاد های گوسفندان بومی ایران از 01/0 تا 12/0 متغیر بود. کمترین مقدار ضریب همخونی ژنومی در ژنوم گوسفند مغانی مشاهده شد (01/0) و بیشترین مقدار ضریب همخونی در ژنوم گوسفند افشاری مشاهده شد. همچنین مقادیر میانگین درصد هتروزیگوسیتی مشاهده و مورد انتظار محاسبه شده برای چند ریختی های تک نوکلیوتیدی در ژنوم اکوتیپ های گوسفندان بومی ایران از 67/20 تا 06/23 و 415/32 تا 421/32 متغیر بود.
کلید واژگان: گوسفندان بومی ایران, توالی یابی کل ژنوم, چند ریختی های تک نوکلئوتیدیPurposeIran is considered to be one of the oldest centers of domestication and breeding of livestock and poultry species in the world. Currently, different ecotypes of indigenous sheep are kept in different geographical regions of the country, which have obvious differences from each other in terms of appearance and production characteristics. So far, there has not been a comprehensive study on the whole genome level to identify the genetic diversity of native Iranian sheep. Therefore, the aim of this study is to identify the genomic characteristics of these native reserves in order to organize appropriate programs for their exploitation and protection
Materials and methodsIn this study, the whole genome sequences of 29 native Iranian sheep were downloaded from the NCBI database and analyzed. Whole genome sequencing of the studied data has been done by Hiseq2000 and Hiseq X Ten sequencer devices. Quality control of raw data sequences was done by FastQC program. To align the sequence data with the sheep reference genome (Oar v.4.0, https://www.ncbi.nlm.nih.gov/assembly/GCF_000298735.2), the BWA-MEM algorithm used in the BWA software package was used. Picard program was used to remove PCR duplicates from mapping outputs. The alignment outputs with the reference genome were processed in two stages, including re-alignment of deletions and small insertions and recalibration of the base quality score using the GATK program. The average coverage depth and alignment percentage for alignment output with the reference genome were calculated using depth and flagstat commands used in samtools software. Single nucleotide polymorphisms (SNPs) were identified by the UnifiedGenotyper tool used in the GATK program. Nucleotide diversity values and genomic inbreeding coefficient were calculated based on homozygous SNPs for each individual using the het command used in the VCFtools program.
ResultsThe average coverage depth of the used data in this study was 18.39 X. The average percentage of alignment of short sequences with the sheep reference genome was 99.89%. The values of genomic inbreeding coefficient in Iranian native sheep breeds ranged from 0.01 to 0.12. The lowest value of genomic inbreeding coefficient was observed in the genome of Mughani sheep (0.01) and the highest value of inbreeding coefficient was observed in the genome of Afshari sheep. Also, the average values of observed and expected percentage of heterozygosity calculated for single nucleotide polymorphisms in the genome of Iranian native sheep ecotypes ranged from 20.67 to 23.06 and 32.415 to 32.421.
Keywords: Iranian native sheep, whole genome sequencing, single nucleotide polymorphisms -
هدف
به دلیل سازگاری با شرایط محیطی، اکوتیپ های متفاوتی از بز بومی در مناطق جغرافیایی مختلف کشور دیده می شوند که به لحاظ ویژگی های ظاهری و تولیدی تنوع زیادی دارند. تاکنون مطالعه جامعی در سطح کل ژنوم برای شناسایی تنوع ژنتیکی بز های بومی صورت نگرفته است. لذا هدف این مطالعه شناسایی ویژگی های ژنومیکی این ذخایر بومی بمنظور سازماندهی برنامه های مناسب برای بهره برداری و حفاظت از آنها است.
مواد و روش هادر این مطالعه توالی های کل ژنوم 36 راس بز بومی ایران از پایگاه دادهNCBI دانلود و آنالیز شد. توالی یابی کل ژنوم داده های مطالعه شده به صورت Paired-End توسط شرکت ایلومینا و دستگاه های توالی یاب Hiseq2500 و Hiseq2000 انجام شده است. کنترل کیفیت توالی داده های خام توسط برنامهFastQC انجام شد. برای همردیفی توالی داده ها با ژنوم مرجع بز (ARS1, GCF_001704415.1) از الگوریتم BWA-MEM بکار برده شده در بسته نرم افزاری BWA استفاده شد. برای حذف PCR duplicates از خروجی های همردیفی از برنامه Picard استفاده شد. پردازش خروجی های همردیفی با ژنوم مرجع در دو مرجله شامل همردیفی مجدد حذف و اضافه های کوچک و کالیبره کردن مجدد نمره کیفیت باز با استفاده از برنامه GATK انجام شد. میانگین عمق پوشش برای خروجی های همردیفی با ژنوم مرجع با استفاده از دستور depth به کار برده شده در نرم افزارsamtools محاسبه شد ند. چندریختی های تک نوکلیوتیدی (SNPs) توسط ابزار UnifiedGenotyper بکار رفته در برنامه GATK شناسایی شد ند. مقادیر تنوع نوکلیوتیدی و ضریب همخونی ژنومی بر اساس SNP های هموزیگوت برای هر فرد با استفاده از دستور het به کار رفته در برنامهVCFtools محاسبه شد ند.
نتایجمیانگین عمق پوشش داده های استفاده شده در این مطالعه X 25/11 بود. میانگین تعداد چند ریختی های تک نوکلیوتیدی در ژنوم 36 راس بز بومی ایران 7495554 بود. مقادیر ضریب همخونی ژنومی در اکوتیپ های مختلف بز های بومی ایران از 01/0 - تا 4/0 متغیر بود. کمترین مقدار ضریب همخونی ژنومی در ژنوم اکوتیپ بز بومی همدان مشاهده شد (01/0 -) و بیشترین مقدار ضریب همخونی در ژنوم اکوتیپ بز بلوچی سیستان و بلوچستان مشاهده شد. همچنین مقادیر میانگین درصد هتروزیگوسیتی مشاهده و مورد انتظار محاسبه شده برای چند ریختی های تک نوکلیوتیدی در ژنوم اکوتیپ های بز بومی ایران از 27/10 تا 75/17 و 33/17 تا 57/17 متغیر بود.
نتیجه گیریاین پژوهش بینش مهمی در مورد تنوع ساختاری ژنوم بز های بومی ایران را نشان می دهد که تا کنون از نظر ژنتیکی مورد ارزیابی قرار نگرفته اند. نتایج بدست از این تحقیق می تواند در طراحی برنامه های حفاظتی و اصلاح نژادی برای بز های بومی ایران مورد استفاده قرار گیرند.
کلید واژگان: بز بومی ایران, توالی یابی کل ژنوم, چند ریختی های تک نوکلئوتیدیObjectiveDue to adaptation to environmental conditions, different ecotypes of native goat can be seen in different geographical regions of the country, which are very diverse in terms of appearance and production characteristics. So far, no comprehensive study has been done at the whole genome level to identify the genetic diversity of native goats. Therefore, the aim of this study is to identify the genomic characteristics of these native reserves in order to organize appropriate programs for their exploitation and protection.
Materials and methodsIn this study, the whole genome sequence of 36 Iranian native goats were downloaded from the NCBI database and analyzed. Whole genome sequencing of the studied data was done by Illumina company and Hiseq2500 and Hiseq2000 sequencing machines. Quality control of raw sequence data was done by FastQC program. The BWA-MEM algorithm applied in the BWA software package was used to align the data sequence with the goat reference genome (ARS1, GCF_001704415.1). The alignment outputs with the reference genome were processed in two steps, including realignment around small deletions and insertions and base quality score recalibration using GATK program.The mean depth for the alignment output with the reference genome was calculated using the depth command applied in the samtools software. Single nucleotide polymorphisms (SNPs) were identified by the UnifiedGenotyper tool used in the GATK program. The values of nucleotide diversity and genomic inbreeding coefficient based on homozygous SNPs for each individual were calculated using the het command used in the VCFtools program.
ResultsThe mean depth of the used data in this study was 11.25 X. The average number of single nucleotide polymorphisms in the 36 Iranian native goat genomes was 7495554. The genomic inbreeding coefficient values in different ecotypes of Iranian native goat varied from -0.01 to 0.4. The lowest genomic inbreeding coefficient value was observed in the Hamedan native goat genome (-0.01) and the highest genomic inbreeding coefficient value was observed in the Balochi goat ecotype genome of Sistan and Baluchistan. Also, the average of percentage observed and expected of heterozygosity values was calculated for single nucleotide polymorphisms in the o Iranian native goat ecotype genomes varied from 10.27 to 17.75 and from 17.33 to 17.57.
ConclusionsThis research shows an important insight about the structural diversity of the Iranian native goat genomes, which have not been evaluated genetically so far. The results obtained from this research can be used in the design of conservation and breeding programs for Iranian native goats.
Keywords: : Iranian native goat, SNPs, whole genome sequencing -
پسته یکی از مهم ترین محصولات باغی است که به دلیل دوپایه بودن و هتروزیگوسیتی بالا، دارای تنوع ژنتیکی زیادی است، از این رو شناسایی تنوع ژنتیکی موجود در بین ژنوتیپ های پسته در جهت اصلاح و تولید ارقام مقاوم به پسیل اهمیت ویژه ای دارد. پسیل پسته یکی از مهم ترین آفات درخت پسته است که پوره و حشرات بالغ این آفت با مصرف شیره گیاه سبب افزایش میزان پوکی، عدم خندانی و همچنین کاهش عملکرد می شود. در این پژوهش چندشکلی های تک نوکلیوتیدی و حذف و اضافه کوچک در چند رقم ایرانی پسته حساس (اکبری، کله قوچی، احمدآقایی، ممتاز) و مقاوم (بادامی زرند، حاج عبداللهی، ایتالیایی، سرخس) به پسیل مورد بررسی قرار گرفت. ابتدا خوانش ها با ژنوم مرجع هم ردیف شدند و سپس چندشکلی های تک نوکلیوتیدی و حذف و اضافه های کوچک مشخص شدند. درصد هم ردیفی خوانش ها با ژنوم مرجع بالای 96 درصد بود که نشان دهنده کیفیت بالای هم ردیفی بود. ارقام حساس به ترتیب دارای 2920688 و 701109 و ارقام مقاوم دارای 2919898 و 701000 چندشکلی تک نوکلیوتیدی و حذف و اضافه کوچک بود. در مجموع، نتایج تجزیه و تحلیل داده ها نشان داد که تنوع ساختاری و چندشکلی تک نوکلیوتیدی و حذف اضافه کوچک ژنوم در ارقام حساس بیشتر از ارقام مقاوم است.
کلید واژگان: پسته, تنوع نوکلئوتیدی, توالی یابی کل ژنوم, مقاومت به آفت, GATKPistachio is one of the most important crops that have a large genetic diversity due to its dicotyledonous and high heterozygosity, so identifying these genetic differences is of particular importance for breeding and production of psyllid-resistant pistachio cultivars. Pistachio psyllid is one of the most important pests of the pistachio tree. The nymphs and adult insects of this pest increase the amount of porosity, and reduce yield and lack of laughter, by consuming plant sap. In this study, single nucleotide polymorphisms (SNP) and small indels were investigated in Iranian pistachio sensitive cultivars (Akbari, Kalehghoochi, Ahmad Aghaei, Momtaz) and resistant cultivars (Badami Zarand, Haj Abdollahi, Italian, Sarakhs) to psyllids. The readings were first aligned with the reference genome, and then single-nucleotide polymorphisms and deletions, and small indels were identified by the GATK toolkit. The percentage of alignment of the readings with the reference genome was above 96%, which indicated the high quality of alignment. Sensitive cultivars had 2920688 and 701109 and resistant cultivars had 2919898 and 701000 SNP and small indels, respectively. In general, the results of data analysis showed that the structural and polymorphic diversity of mononucleotides and the small indels are greater in susceptible cultivars than in resistant cultivars.
Keywords: Pistachio, Nucleotide diversity, Pest resistance, Whole genome sequencing, GATK -
هدف
ارزیابی و حفاظت از مرغان بومی به عنوان ذخایر ژنتیکی ارزشمند ضروری است. مطالعه حاضر اولین پژوهش برای شناسایی واریانت های ژنتیکی در مرغ لاری با اطلاعات توالی یابی کل ژنوم است. مطالعه تنوع ژنتیکی مرغ لاری در سطح ژنوم، می توانند اطلاعات مفیدی را در جهت حفظ و اصلاح نژاد آن فراهم سازد. در این تحقیق تنوع ژنومی پنج قطعه مرغ از نژادلاری با استفاده از تکنیک توالی یابی کل ژنوم بررسی شد.
مواد و روش هانمونه خون پنج قطعه مرغ بومی لاری از شهرهای شیراز و زابل گرفته شد. توالی یابی کل ژنوم به صورت رفت و برگشتی توسط شرکت ایلومینا 2500 Hiseq در کشور چین انجام شد. کیفیت داده ها توسط برنامهFastQC بررسی شد ند. داده ها به وسیله الگوریتم MEM به کار برده شده در برنامه BWA با ژنوم مرجع (Gallus_gallus-5.0/galGal) همردیف شد ند. پردارش bam فایل ها در چندین مرحله انجام شد. PCR duplicates توسط برنامه Picard حذف شدند. درصد همردیفی با ژنوم مرجع و کاوریج یا عمق پوشش با استفاده از دستورات flagstat و depth به کار برده شده در نرم افزار samtools محاسبه شد ند. چندریختی های تک نوکلیوتیدی (SNPs) و حذف و اضافه های کوچک ژنوم با برنامه GATK شناسایی شد ند. مستند سازی چند ریختی های تک نوکلیوتیدی و حذف و اضافه های کوچک ژنوم با برنامه SnpEff انجام شد. تنوع ژنتیکی ژنوم پنج مرغ با برنامه VCFtools محاسبه شد.
نتایجمیانگین درصد همردیفی توالی های کوتاه با ژنوم مرجع 85/ 99 درصد بود و میانگین عمق پوشش 65/7 X بود. در این پژوهش 9851731 چند ریختی تک نوکلیوتیدی و 1024139 حذف و اضافه کوچک بدست آمد که بیشترین مقدار آن در نواحی اینترون و بین ژنی مشاهده شد. میانگین درصد هتروزیگوسیتی مشاهده شده و مورد انتظار برای جایگاه های چند ریختی های تک نوکلیوتیدی شناسایی شده برای ژنوم پنج مرغ به ترتیب 30/0 و 35/0 بود.
نتیجه گیرینتایج مستند سازی نشان داد که درصد چندریختی های تک نوکلیوتیدی خاموش (38/%74) بیشتر از درصد چندریختی های تک نوکلیوتیدی غیر مترادف (بد معنی و بی معنی، 62/25%) در ژنوم مرغ است. کمتر بودن تنوع ژنتیکی مشاهده شده از تنوع ژنتیکی مورد انتظار، به وجود نیرو هایی مثل همخونی در جمعیت مرغ لاری می توان اشاره کرد. اطلاعات بدست آمده از این پژوهش، می تواند برای برنامه های حفاظت و اصلاح نژادی و نیز بررسی ساختار جمعیتی سودمند واقع شوند.
کلید واژگان: توالی یابی کل ژنوم, چند ریختی های تک نوکلئوتیدی, حذف و اضافه های کوچک, مرغ لاریObjectiveEvaluation and conservation of native chickensas valuable genomic resources is essential.This is the first study for discovering variants in Lari chicken by whole genome sequencing data. The study of genetic diversity of Lari chicken at genomic level can provide useful information for its preservation and breeding. In this study, genomic diversity of five Lari individuals was investigated using whole genome sequencing technique.
Materials and methodsBlood samples were taken from five Lari chickens from cites of Shiraz and Zabol, Iran. Whole genome sequencing (paired end sequencing) was done by Illumina Company) Hiseq 2500). Data quality was determined by FastQC program. Whole genome sequencing datawere aligned with chicken genome reference(Gallus_gallus-5.0/galGal5) using MEM algorithm applied in burrows wheeler aligner program (BWA). Processing of bam files was done in several steps. PCR duplicates were removed using Picard program. The Percentage of alignment with the reference genome and coverage or depth were calculated using the flagstat and depth commands in samtools software. Single nucleotide polymorphisms (SNPs) and small insertions and deletions (INDELs) were identified by the genomic analysis toolkit (GATK)program. Annotation of SNPs and Indels was done using SnpEff program. Genetic diversityof five chicken genomes was calculated with VCFtools.
ResultsThe mean percentage mapping of short sequences with the reference genome was 99.85% and the mean coverage depth was 7.65 X. In this study, 9.8 million SNPs and 10 million Indels were identified with the most counts of them in the intron and intergenic regions. The mean ofobserved and expected heterozygosity percentages for SNPs in five chicken genomes were 0.30 and 0.35, respectively.
ConclusionsResults from annotation showed that percentage of silentSNPs (74.38%) is higher than that nonsynomous SNPs (missense and nonsense, 25.62%) in Lari chicken genome. The lower observed genetic diversity than the expected genetic diversity, can be due to the forces such as inbreeding in the population of Lari chicken
Keywords: : Indels, Lari chicken, SNPs, whole genome sequencing -
هدف
حدود نیمی از ژنوم انسان توسط توالی های تکراری پوشش داده شده است. این توالی ها در ژنوم پستانداران دیگر نیز دارای سهم بسزایی بوده و از این رو مطالعه این بخش ازژنوم می تواند اطلاعات ارزشمندی را در زمینه تکامل در اختیار محققین قرار دهد. این تحقیق با هدف توالی یابی و گردآوری کل ژنوم شتر های دوکوهانه ایرانی برای شناسایی عناصر متحرک و مطالعه میزان پراکنش آنها در ژنوم این گونه، طراحی و اجرا شد. همچنین نتایج مربوط به شترهای دوکوهانه ایرانی، با شترهای دوکوهانه غیرایرانی و شترهای تک کوهانه مورد مقایسه قرار گرفت.
مواد و روش هادر این مطالعه ژنوم 6 نفر شتر دو کوهانه ایرانی برای شناسایی عناصر متحرک توالی یابی شد. توالی یابی کل ژنوم شترهای دو کوهانه با استفاده از پلتفرم Illumina HiSeq 2000 و به صورت دو انتها انجام گرفت. برای کنترل کیفیت و پالایش خوانش های خام از به ترتیب از نرم افزارهای FastQC و Trimmomatic استفاده شد. با استفاده از برنامه CLC Genomics Workbench گردآوری دنوو شترهای دوکوهانه انجام گرفت. جهت شناسایی عناصر متحرک کل ژنوم نیز از روش شناسایی مبتنی بر همولوژی در برنامه RepeatMasker استفاده شد.
نتایجنتایج گردآوری ژنوم های توالی یابی شده نشان داد که اندازه ژنوم در این نمونه ها در محدوده 9/1 تا Gb 97/1 قرار دارد. در پژوهش حاضر، درصد عناصر متحرک در ژنوم شش شتر دو کوهانه مورد مطالعه، به طور میانگین 89/29 از کل ژنوم گزارش شد. در بین عناصر متحرک شناسایی شده، درصد توالی های LINE برای شترهای دو کوهانه به طور میانگین 58/17 برآورد شد. بطوریکه این توالی ها ، بزرگ ترین گروه توالی های تکراری در شترهای دو کوهانه در مطالعه حاضر بودند. توالی های تکراری SINE نسبت به LINE ها مقدار کمتری داشتند بطوریکه که فقط 45/3 درصد از کل ژنوم شترهای مورد مطالعه را به خود اختصاص دادند. مطابق با نتایج شترهای تک کوهانه ایرانی، هیچ عنصر Alu در ژنوم شترهای دوکوهانه ایرانی نیز شناسایی نشد.
نتیجه گیریکمبود اطلاعات ژنومیکی و زیستی در مورد شترها، یکی از عوامل بازدارنده در پیشبرد اهداف و برنامه های اصلاح نژادی در این گونه به حساب می آید. هرچند این مطالعه به تنهایی کافی نیست اما می تواند گامی برای شروع تولید داده های ژنومیکی برای شترها باشد. ادامه این نوع مطالعات و تجمیع اطلاعات زیستی و ژنومیکی در واقع زمینه را برای شروع اصلاح نژاد نوین در شترهای ایرانی فراهم خواهد کرد.
کلید واژگان: توالی تکراری, توالی یابی کل ژنوم, شترهای دو کوهانه ایرانی, عناصر متحرکAbout half of the human genome is covered by repetitive sequences. These sequences have a large share in the other mammalian genomes, therefore studying this part of the genome can provide researchers valuable information on evolution. The aim of this study was to sequencing and assembly the whole genome of Iranian Bactrian camels to identify transposable elements and their distribution in the genome of this species. In addition, the results of Iranian Bactrian camels were compared with non-Iranian Bactrian camels and dromedary camels.
Materials and methodsIn this study, the whole genome of six Iranian Bactrian camels was sequenced to transposable elements identification. Iranian Bactrian camel whole genome sequenced using Illumina HiSeq 2000 system in paired-end. FastQC and Trimmomatic software were used to quality control and quality filtering of raw sequencing reads, respectively. CLC Genomics Workbench (CLC Bio, Aarhus, Denmark) was used to de novo assembly of trimmed reads. Also, we used the RepeatMasker program to search for transposable elements using a homology-based method.
ResultsResults of the assembling of sequenced genomes showed that the genome size in these samples ranged from 1.9 to 1.97 Gb. In the present study, the percentage of transposable elements for six Iranian Bactrian camels was 29.89% on average of the whole genome. The percentage of LINE sequences for the Iranian Bactrian camel was 17.58% on average. So, these sequences were considered as the largest group of transposable elements in the Bactrian camel in this study. SINE elements showed a lower number in comparison with LINEs. So that, only 3.45% of the total Bactria camel genome length was dedicated to the SINEs. In accordance with the results of Iranian dromedary camels, no Alu element was identified in the genome of Iranian Bactrian camels.
ConclusionShortage of genomic and biological information about camels is one of the inhibiting factors in advancing the breeding goals and programs. Although this study is not enough alone, it can be a step towards starting the production of genomic data for camels. Continuing this kind of study and integrating biological and genomic information will provide the ground for the start of modern breeding in Iranian camels.
Keywords: Iranian Bactrian Camel, Repetitive Sequences, Transposable Elements, whole genome sequencing -
هدف
ارزیابی و حفاظت از مرغان بومی به عنوان ذخایر ژنتیکی آینده ضروری است. در این تحقیق تنوع ژنومی چهار قطعه مرغ از نژاد مرندی با استفاده از تکنیک توالی یابی کل ژنوم بررسی شد.
مواد و روش هانمونه خون چهار قطعه مرغ بومی از استان آذربایجان شرقی گرفته شد. توالی یابی کل ژنوم به صورت -End paired یا دو سویه توسط شرکت ایلومینا 2500Hiseq انجام شد. کیفیت داده ها توسط برنامه FastQC بررسی شد ند. داده ها به وسیله الگوریتم MEM به کار برده شده در برنامه BWA با ژنوم مرجع (Gallus_gallus-5.0/galGal5) همردیف شد ند. چندریختی های تک نوکلیوتیدی (SNPs) و حذف و اضافه های کوچک ژنوم با برنامه GATK شناسایی شد ند. مستند سازی چند ریختی های تک نوکلیوتیدی و حذف و اضافه های کوچک ژنوم با برنامه SnpEff انجام شد. تنوع ژنتیکی ژنوم چهار مرغ با برنامه VCFtools محاسبه شد.
نتایجدرصد همردیفی توالی های کوتاه با ژنوم مرجع بالای 99 درصد بود و میانگین عمق پوشش X7 بود. در این پژوهش 8679990 چند ریختی تک نوکلیوتیدی و 911095 حذف و اضافه کوچک بدست آمد که بیشترین مقدار آن در نواحی اینترون و بین ژنی مشاهده شد. میانگین درصد هتروزیگوسیتی مشاهده شده و مورد انتظار برای جایگاه های چند ریختی های تک نوکلیوتیدی شناسایی شده برای ژنوم چهار مرغ به ترتیب 33/0 و 35/0 بود.
نتیجه گیرینتایج مستند سازی نشان داد که درصد چندریختی های تک نوکلیوتیدی خاموش (64/74 درصد) بیشتر از درصد چندریختی های تک نوکلیوتیدی غیر مترادف (بد معنی و بی معنی، 36/25 درصد) در ژنوم مرغ است. اطلاعات بدست آمده از این پژوهش، می تواند برای برنامه های اصلاح نژادی و حفاظتی و نیز بررسی های ساختار جمعیتی سودمند واقع شوند.
کلید واژگان: توالی یابی کل ژنوم, چند ریختی های تک نوکلئوتیدی, حذف و اضافه های کوچک, مرغ مرندیObjectiveEvaluation and conservation of native chickens as future genomic resources are essential. In this study, genomic diversity of four Marandi breeds was investigated using whole genome sequencing technique.
Materials and MethodsBlood samples were taken from four chickens in East Azerbaijan province, Iran. Whole genome sequencing (paired end sequencing) was done by Illumina Company) Hiseq 2500). Data quality control was performed by FastQC program. Whole genome sequencing data were aligned with genome reference (Gallus_gallus-5.0/galGal5) using MEM algorithmimplemented in burrows wheeler aligner program (BWA). Single nucleotide polymorphisms (SNPs) and small insertions and deletions (INDELs) were identified by the GATK program. Annotation of SNPs and Indels was done using SnpEff program. Genetic diversity of 4 chicken genomes was calculated with VCFtools.
ResultsThe short sequences were compared with the reference genome of over 99% and with the mean depth of 7X coverage. In this study, 8.7 million SNPs and 9.1 Indels were identified with the most counts of them in the intron and intergenic regions. The mean of observed and expected heterozygosity percentages for SNPs in four chicken genomes were 0.33 and 0.35, respectively.
ConclusionResults from annotation showed that percentage of the silent SNPs (74.64%) is higher than that the nonsynomous SNPs (missense and nonsense) in Marandi chicken genome. The results obtained from this research can be useful for Marandichicken breeding and conservation programs.
Keywords: InDels, Marandi chicken, SNPs, whole genome sequencing -
مطالعه حاضر، اولین پژوهش برای شناسایی واریانت های ژنتیکی در لاین آرین با اطلاعات توالی یابی کل ژنوم است. مطالعه خصوصیات لاین آرین در سطح ژنوم، می تواند تفاوت های ژنتیکی آن را در ارتباط صفات مهم اقتصادی از جمله رشد شرح دهد. در این پژوهش، از اطلاعات توالی کل ژنوم سه قطعه مرغ آرین استفاده شد. نتایج نشان داد که 63866 واریانت بین نمونه ها مشترک است که از این تعداد، 17604 واریانت به عنوان واریانت جدید برای اولین بار در این پژوهش گزارش شدند. همچنین، 604 واریانت در مناطق کدکننده ژنوم وجود دارند که از این تعداد، 204 واریانت منجر به تغییر در نوع آمینواسیدی پروتئین ها می گردند. با توجه به مهم بودن کیفیت پروتئین جیره برای رشد و افزایش وزن برای طیور، نتایج ژن آنتولوژی نشان داد که مسیر کاتابولیسم پروتئین ها و مسیرهای تغییرات پس از ترجمه ی پروتئین های مرتبط با رشد دارای اهمیتی دوچندان هستند. همچنین، ژن های کاندیدایSMURF2 و SUMO1 برای این مسیرهای بیولوژیک پیشنهاد شد. یکی دیگر از نتایج قابل توجه ژن آنتولوژی، معنی دار شدن مسیرهای پاسخ به تنش بود. در لاین آرین به دلیل انتخاب شدید برای دستیابی به پیشرفت ژنتیکی بالا در صفات رشد، وجود تنش اجتناب ناپذیر است. بنابراین، معنی دار شدن مسیرهای پاسخ به تنش، می تواند نشان دهنده اهمیت این مسیرها در ارتباط با عملکرد مطلوب باشد.کلید واژگان: لاین آرین, توالی یابی کل ژنوم, واریانتThis is the first study for discovering genetic variants in Arian line by whole genome sequencing data. The study of Arian line features at genomic level can unravel the genetic background of economic traits such as growth. In this study, the information of three whole genomes of Arian chickens were used. The results of this study indicated that, there were 63866 common variants among samples. 17604 variants Out of 63866 variants were reported as novel variants in this study. Also 604 variants are located in coding regions, which 204 out of them lead to change in the amino acid sequence of the proteins. Considering the importance of dietary protein quality for growth and weight gain for poultry, the results of gene ontology analysis indicated that the pathways of protein catabolism and post-translational modification of proteins, related to growth are considerable. Also candidate genes such as, SMURF2 and SUMO1 was suggested for these biological pathways. Another interesting result of gene ontology was the significance of response to stress pathways. In the Arian line due to intense selection, the existence of stress is inevitable. Therefore, the significance of stress response can indicate the importance of these pathways in relation to the desired performance.Keywords: Arian line, Whole-genome sequencing, Variants
- نتایج بر اساس تاریخ انتشار مرتب شدهاند.
- کلیدواژه مورد نظر شما تنها در فیلد کلیدواژگان مقالات جستجو شدهاست. به منظور حذف نتایج غیر مرتبط، جستجو تنها در مقالات مجلاتی انجام شده که با مجله ماخذ هم موضوع هستند.
- در صورتی که میخواهید جستجو را در همه موضوعات و با شرایط دیگر تکرار کنید به صفحه جستجوی پیشرفته مجلات مراجعه کنید.