HGVS,全称是Human Genome Variation Society,即人类基因组变异协会的缩写。

摘要:
如果没有指明,转录本仅基于c。无法将1384 delG这样的描述减少到参考基因组变异位置。此外,碱基可以同时插入和删除,例如c 6775delTCinsGA,这意味着与参考序列相比,第6775位缺失TC,并被GA取代。剪接位点的SNV和InDel变体都可以引起选择性剪接突变。这种突变没有特殊的书写方法,一般需要注意其位置。有关HGVS命名约定的更多信息,请参见http://varnomen.hgvs.org/recommendations/general/ 。 人类基因组变异协会的规则被学术界普遍接受。此外,基因突变通常通过蛋白质水平的变化来描述。

HGVS,全称是Human Genome Variation Society,即人类基因组变异协会的缩写。它制定了一套规则,告诉人们如何描述一个变异,以便于学术交流和计算机识别。

HGVS的命名规则

在命名时,需要在DNA、RNA和蛋白质三个层面描述同一个变异,这充分体现了此命名法则对变异本身功能性体现的考虑。

HGVS的命名规则

DNA转录为RNA,RNA翻译成蛋白质

让我们来看一下,基因检测报告中是怎么使用HGVS命名的吧。以下是基因检测结果表格示意(点击图片放大)。

HGVS的命名规则

其中第3-4列使用了HGVS命名法则。

染色体位置:写清版本号

在描述一个变异在某个染色体上的坐标时,参考基因组的版本号是需要标明的。目前使用较多的是GRCh37/hg19和GRCh38/hg38。其中基于GRCh37/hg19的注释软件和数据库较为完备,在临床检测中仍有较多使用。新版本GRCh38/hg38的总体组装碱基数量要多于旧版本GRCh37/hg19,但也因此造成两个版本基因组坐标不同。

chr6:35927523

代表6号染色体的35927523位置发生变异(基于GRCh37/hg19版本的坐标)

编码序列位置:注意转录本

基因检测结果表格第3列有以“c.”开头的变异命名,这代表了编码序列(coding DNA referencesequence)上变异的相应位置。

chr6:35927523,c.1384delG

代表6号染色体的35927523位置发生变异,对应SLC26A8基因NM_138718转录本的第1384位,此位置发生了G碱基的缺失。

转录本如不注明(见第5列),仅根据c.1384delG这样的描述,是没有办法还原为参考基因组变异位置的。

蛋白序列位置:也要对应转录本

表格第4列为“p.”开头,表示蛋白序列(protein reference sequence)上面变异的相对位置。

chr6:35927523,c.1384delG,p.V462fs

代表6号染色体的35927523位置发生变异,对应SLC26A8基因NM_138718转录本的第1384位,此位置发生了G碱基的缺失,导致了相应蛋白序列462位的缬氨酸(V)处发生移码变异(fs, frameshift)。

总之,染色体位置、编码序列位置和蛋白序列位置三者的关系可以表示为下图:

HGVS的命名规则

HGVS命名部分简写形式

SNV变异

【编码序列】所有的SNV变异均为碱基替换,以符号“>”进行表示;如:c.123A>T,表示与参考序列相比,第123位的A被T所取代;

【蛋白序列】错义突变,写法如p.Trp26Cys,表示第26位的Trp被Cys取代;无义突变,写法如p.Trp26*或p.W26X,表示26位的Trp变成终止密码子。

InDel变异

【编码序列】InDel变异会导致碱基的插入或(和)缺失。插入指与参考序列相比,一个或多个碱基增加的现象,如c.5756_5757insAGG,则表示在第5756 与5757位点之间插入了三个碱基AGG;而c.2052delAGG,表示与参考序列相比,第2052位发生AGG的缺失。另外,碱基可同时发生插入和缺失,如c.6775delTCinsGA,表示与参考序列相比,第6775位缺失了TC,被GA取代。最后,另外,对于8个T变成9个T,或者5个AG变成6个AG这种短序列重复有特殊的写法,如c.6_8dupT,表示从第6位到第8位发生了T的重复。

【蛋白序列】移码突变,写法如p.G48fs,表示第48位从甘氨酸处发生移码突变;非移码突变,写法如p.Arg75_Asp76insGly,表示75和76位中间插入一个甘氨酸。

剪切位点变异

SNV和InDel变异均会造成选择性剪切突变,这种变异没有特别的写法,一般需要注意其发生的位置。例如,c.464-2A>T表示外显子边界-2bp处发生了A到T的变异,将影响剪切。由于此类位点通过影响剪切体危害蛋白结构,有致病可能性。

相信您已经可以读懂检测报告上的变异命名了。更多关于HGVS命名法则的信息见

http://varnomen.hgvs.org/recommendations/general/。

参考文献

[1]Den Dunnen J T, Dalgleish R, Maglott D, et al. HGVS Recommendations for the Description of Sequence Variants: 2016 Update[J]. Human Mutation, 2016, 37(6): 564-569.

来源:不育识遗 https://mp.weixin.qq.com/s/Z5kjz-q7V0wCGnekbaPQow

导读:随着二代测序技术临床应用的不断增加,越来越多与癌症发生发展密切相关的突变被鉴定出来。将基因突变的结果更好地转化为实际临床应用,统一而通用的突变命名规则就显得尤为重要。人类基因组变异协会(HGVS:Human Genome Variation Society)规则是目前学术界所公认的命名规则。

从不同的维度出发,相同的基因突变可以有多种不同的表现形式,例如,参考序列的不同、表现层次的不同(DNA、RNA或者蛋白质水平)都会导致突变的表现方式产生差异。

目前,通用的参考序列主要包括:基因组参考序列(以前缀“g.”表示)、cDNA参考序列(以前缀“c.”表示)、非编码DNA参考序列 (以前缀“n.”表示)、RNA参考序列(以前缀“r.”表示)、蛋白质参考序列(以前缀“p.”表示)。

参考序列的选择非常重要。在DNA水平描述突变时,内含子与相邻外显子的关系对于临床研究往往非常重要,为了能更好地阐明内含子的变异,通常会选择cDNA作为参考序列,这是因为以cDNA作为参考序列,能够更好的描述内含子中突变碱基与相邻外显子之间的关系。另外,基因突变也常以蛋白质水平的变化进行描述。

结合临床常用的描述基因突变的参考序列,我们将会重点从cDNA层面以及蛋白质层面就不同突变的类型分别进行举例说明。

以cDNA为参考序列的突变表达方式

  • 替换:指与参考序列相比,一种碱基被另一种碱基所取代;以符号“>”进行表示;如:c.123A>T,表示与参考序列相比,第123位的A被T所取代;

  • 缺失:指与参考序列相比,一个或多个碱基缺失的现象;以“del”进行表示;如:c.2052delA,表示与参考序列相比,第2052位发生A的缺失;

  • 插入:指与参考序列相比,一个或多个碱基增添的现象;以“ins”进行表示;如:c.5756_5757insAGG,表示与参考序列相比,在第5756 与5757位点之间插入了三个碱基AGG;

  • 缺失插入:指与参考序列相比,一个或多个碱基被其他碱基所取代的现象,并且这种变异不包括替换突变、倒置以及转换突变;以“delins”进行表示;如:c.6775delinsGA,表示与参考序列相比,第6775位缺失了一个碱基,同时缺失的碱基被GA做取代;

  • 重复:指与参考序列相比,包含一个或多个碱基的拷贝以插入的形式直接掺入序列中的现象;以“dup”进行表示;如:c.6_8dupT,表示从第6位到第8位发生了T的重复;

此外,为了更好地理解内含子中碱基突变的表现形式,我们首先来了解一下DNA序列中各碱基所处的位置,如下图所示:

HGVS,全称是Human Genome Variation Society,即人类基因组变异协会的缩写。第5张

核苷酸编码示意图

在图中可以看出,从起始密码开始到终止密码为止,外显子序列的编号是连续的,而5'非翻译区、3'非翻译区以及内含子区的编码都是与外显子序列的编码密切相关的。

因此,内含子中碱基的替换、缺失、插入等突变的表现形式就可以分别表示为:c.36+1G>T(c.36前一段编码区域或者说前面一个外显子的最后一个碱基位于编码区36位,+1代表这个外显子挨着的后面的内含子的第一个碱基);c.(4071+1_4072-1)_(5154+1_5155-1)del(表示两个外显子之间的序列发生缺失);c.37+1_37+2insATC(表示在“37+1”与“37+2”位点间插入碱基ATC)。

以蛋白质为参考序列的突变表达方式

  • 替换:如p.Trp26Cys,表示第26位的Trp被Cys取代(错义突变);p.Trp26Ter (p.Trp26*),表示第26位的Trp变为终止密码(无义突变);p.Cys123=,表示基因突变之后,氨基酸没有发生改变(同义突变);

  • 缺失:如p.Ala3_Ser5del,表示多肽序列中从第3位的Ala到第5位的Ser发生了缺失;

  • 插入:如p.Lys2_Gly3insGlnSerLys,表示在第2位的Lys和第3位的Gly之间插入了GlnSerLys;

  • 插入缺失:如p.Cys28delinsTrpVal,表示第28位的Cys缺失,同时被TrpVal取代;

  • 重复:如p.Ala2[10],表示第2位的Ala重复了10次;

  • 移码突变:在起始密码子和终止密码子之间的读码框发生了改变;以“fx”进行表示;如p.Arg97ProfsTer23,表示第97位的Arg是首个发生改变的氨基酸,且Arg变为Pro,同时发生移码突变后,终止密码的位置变为第23位;

免责声明:文章转载自《HGVS,全称是Human Genome Variation Society,即人类基因组变异协会的缩写。》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇springboot配置文件详解使用WinScp上传文件到阿里云服务器上下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

ERA-Interim 的变量TCW和VIWV可降水量

可降水量(Precipitable water) 气象上有一个名词"可降水量"(Precipitable water),可以用来衡量大气的水含量。 其公式为(W=frac{1}{ ho g} int_{p_{1}}^{p_{2}} x d p) 其中({ ho})为空气密度,({g})为重力加速度, ({x})是混合比(mixing ratio , 大气中...

关于HTML的简述

HTML的必要性与简述 1、html(Hypertext Markup Language)(超文本标记语言),是基于http(Hypertext Transfer Protocal)超文本传输协议来进行传输的 2、html是纯文本 3、html是用来描述页面语义与页面结构的 html跟普通文本的区别就在于我们规定了用特殊标签 来特指特定的语义 赋予了标签内...

图形渲染-PBR(一)

todo 毛星云系列 定义 1基于物理的渲染(Physically Based Rendering,PBR)是指使用基于物理原理和微平面理论建模的着色/光照模型,以及使用从现实中测量的表面参数来准确表示真实世界材质的渲染理念。 特征 依据物理世界的参数来调节材质,而不是感觉和试错。 不论光照条件如何,这些材质看上去都会是正确的 判断一种PBR光照模型是...

文献阅读 | Fine definition of the pedigree haplotypes of closely related rice cultivars by means of genome-wide discovery of single-nucleotide polymorphisms

Yamamoto, T., Nagasaki, H., Yonemaru, J. et al. Fine definition of the pedigree haplotypes of closely related rice cultivars by means of genome-wide discovery of single-nucleotide...

Adobe Dreamweaver 添加库、标签和属性

您可以在 Dreamweaver 中使用标签库编辑器添加标签库,并将标签和属性添加到标签库中。 添加一个标签库 在标签库编辑器(“编辑”>“标签库”)中,单击加号 (+) 按钮,然后选择“新建标签库”。 在“库名称”框中,键入一个名称,(例如,Miscellaneous Tags),然后单击“确定”。 将标签添加到标签库 在标签库编辑器...

Latex中为作者添加多个单位属性(IEEE模板)

author{ IEEEauthorblockN{name1 name1IEEEauthorrefmark{1}IEEEauthorrefmark{2},  name2 name2IEEEauthorrefmark{3}, name3 name3IEEEauthorrefmark{1}IEEEauthorrefmark{2}}     IEEEautho...