文献阅读 | Fine definition of the pedigree haplotypes of closely related rice cultivars by means of genome-wide discovery of single-nucleotide polymorphisms

摘要:
随后,通过将其与已发表的Nipponbare序列进行比较,确定了67051个SNP位点。技术细节列表技术细节1。排序和比较2。谱系单倍型的确定2.1结论部分2.2技术细节3。现代水稻育种和基因组多样性变化1。测序和比较统计:测序的深度分布和平均重叠群的数量。短Koshihikari读数未发现Nipponburgemenme的长度分布约76.0Mboft。阅读的分类和比例不能与参考基因组上的阅读统计进行比较。对于成功匹配的部分,计算每个染色体的SNP密度分布,并从所有SNP中随机选择64个SNP。所发现的SNPs的可靠性已通过使用辅助序列的传统Sanger方法进行了验证。

Yamamoto, T., Nagasaki, H., Yonemaru, J. et al. Fine definition of the pedigree haplotypes of closely related rice cultivars by means of genome-wide discovery of single-nucleotide polymorphisms. BMC Genomics 11, 267 (2010). https://doi.org/10.1186/1471-2164-11-267

作者首先利用全基因组测序,测定了日本水稻品种Koshihikari。随后,将其与已发表的Nipponbare序列进行比对,确定了67051个SNP位点。随后,利用1917个SNP位点,对151个Japanese cultivars进行芯片(high-throughput typing array)测定。利用这些数据,作者确定了从traditional landraces中继承而来的、60.9%的Koshihikari基因组、18个共有单倍型块的祖源,并预测现代育种实践普遍减少了遗传多样性。

作为结论,作者评估了相关水稻品种的遗传组成,并借助系谱信息阐明了育种中的染色体重组的动力学过程。作者还发现了及个基因组区域的遗传多样性降低,并猜测时育种中的选择造成的。最后,作者认为,基于SNP的系谱单倍型的确定,将促进水稻和其他作物的育种。

技术细节

目录

1. 测序与比对

统计了:

  • 测序深度分布与平均值
  • contig的数量、长度分布
  • About 76.0 Mb of the Nipponbare genome was not covered by the short Koshihikari reads.并进行了reads的分类与占比
  • 无法比对到参考基因组上的读段统计

对于成功比对的部分,统计了各染色体SNP密度分布,并从全部SNP中随机选取了64各,用traditional Sanger method using a capillary sequencer进行验证,已验证找到的SNP的可靠性。下图为SNP密度分布的部分截图。

SNP密度分布(部分截图)

模拟了测序深度、基因组覆盖度和检测到的SNP数量三者之间的关系,得出10x的测序深度足够了。

统计了SNP的突变类型与占比。

在芯片测序部分,作者在芯片设计上,最初设计了2688个SNP,并在筛选后保留下了1917个

2. 系谱单倍型确定

2.1 结论性部分

选择了日本150年中151个代表性cultivars进行芯片测序。提出由于这些品种是育种系(breeding lines),因此不适用种群结构分析等方法。下图为STRUCTURE软件分析的结果。

STRUCTURE软件分析的结果

作者根据育成年份将这些品种大致分为三类。其中,第二组的育种时期,高产主要目标;第三组所在时期的目标则开始演变为品质。

根据等位基因的对比,作者根据等位基因基因型的对比,确定了各品种的基因组组成(下图)。

各品种的基因组组成

下图展示了Koshihikari前后几代的系谱关系

Koshihikari前后几代的系谱关系

下图展示了基于SNP和系谱信息估计出的Koshihikari基因组组成。尽管系谱单倍型的可靠性受到单倍型块内SNP数量的影响,作者仍确定了60.9%的Koshihikari基因组的系谱单倍型祖源,找出了6个landraces祖先(下图A)。

Koshihikari基因组的系谱单倍型

随后,作者找了几种通过与Koshihikari杂交而育成的、广泛种植的日本水稻品种,并评估了他们从Koshihikari中继承来的基因组片段的位置与比例(上图B)。上图C是一些统计信息。

2.2 技术细节

作者提到,有文章(doi: 10.1101/gr.089516.108)提出了一种基于重组自交系全基因组重测序的高通量的基因分型和重组点估计的方法。但“该方法只能用于基因组序列已被解码的品种,这使得很难将其方法应用于大量独立系或品种上”。因此,作者首先进行了全基因组SNP检测(Koshihikari),然后进行了芯片测序(151个品种)。芯片测序的位点是根据WGS测序找到的。

单倍型块确认上,作者对比了Koshihikari和其祖先的基因型,当相同的基因型块超过500kb时,认为是一个单倍型块。

3. 现代水稻育种与基因组多样性变化

作者通过滑动窗口,估计每单位基因组区域所具有的单倍型数量,并将其作为基因组多样性的指标。

窗口大小由LD估计。We calculated that the LD decay was 2 Mb

免责声明:文章转载自《文献阅读 | Fine definition of the pedigree haplotypes of closely related rice cultivars by means of genome-wide discovery of single-nucleotide polymorphisms》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇算符优先分析Android开发中java与javascript交互:PhoneGap插件vs addJavascriptInterface下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

Comparison of long-read sequencing technologies in the hybrid assembly of complex bacterial genomes

Comparison of long-read sequencing technologies in the hybrid assembly of complex bacterial genomes长read测序技术在复杂细菌基因组 杂交组装中的比较 Nicola De Maio,1 ,†Liam P. Shaw,1 ,*†Alasdair Hubba...

生物信息学: 导论与方法 | 总结笔记

课程链接:生物信息学: 导论与方法 1 导论与历史 1.1 1-1 什么是生物信息学 1.2 1-2 生物信息学历史 1.3 1-3 中国大陆的生物信息学 2 序列比对 2.1 2-1 序列比对中的基本概念 2.2 2-2 利用动态规划进行全局比对 2.3 2-3 从全局比对到局部比对 2.4 2-4 考虑仿射空位罚分的序列比对,以及...

《学习之道》

《学习之道》 专注思维和发散思维 1,专注模式下的思维活动对数学和科学的学习必不可少。它是利用理性、连贯、分解的途径直接解决问题的一种模式。专注模式与大脑前额叶皮层(位置就在脑门正后方)集中注意力的能力相关。你把注意力集中到某样东西上,然后砰的一声,专注模式就开启了。2,发散模式对学数学和科学也同样必不可少。如果我们在一个问题上挣扎了许久而不得思路,它会...

ERA-Interim 的变量TCW和VIWV可降水量

可降水量(Precipitable water) 气象上有一个名词"可降水量"(Precipitable water),可以用来衡量大气的水含量。 其公式为(W=frac{1}{ ho g} int_{p_{1}}^{p_{2}} x d p) 其中({ ho})为空气密度,({g})为重力加速度, ({x})是混合比(mixing ratio , 大气中...

关于EEG参考电极

今天搞ADS1299,里面的BIAS用来去共模的。下面介绍下脑电的电极 The input multiplexer has EEG-specific functions for the bias drive signal. The BIAS signal is available at theBIASOUT pin when the appropriate...

基因芯片和NGS的关系

没事,多看Illumina 的网站:http://www.illumina.com.cn/applications.aspx 基因芯片是1991 年提出的。 基因芯片, 又称DNA微阵列(DNA microarray), 是把大量已知序列探针集成在同一个基片(如 玻片、膜)上, 经过标记的若干靶核苷酸序列与芯片特定位点上的探针杂交, 通过检测杂交信号。对生...