区别samtools faid产生的.fai文件功能和bwa index 产生的四个文件的功能

摘要:
Samtoolsfaidx可以创建带有后缀的文件。fai for the fast sequence fai文件和原始fastsa文件可以快速提取任何区域的序列。用法:samtoolsfaidsinput Fa此命令对输入fasta序列有一定的要求:对于每个序列,除了最后一行之外,其他行的长度必须相同,˃oneATGCATGCATATATATGCATG

samtools faidx 能够对fasta 序列建立一个后缀为.fai 的文件,根据这个.fai 文件和原始的fastsa文件, 能够快速的提取任意区域的序列

用法:

samtools faidx input.fa

该命令对输入的fasta序列有一定要求:对于每条序列,除了最后一行外, 其他行的长度必须相同,

>one
ATGCATGCATGCATGCATGCATGCATGCAT
GCATGCATGCATGCATGCATGCATGCATGC
ATGCAT
>two another chromosome
ATGCATGCATGCAT
GCATGCATGCATGC

最后生成的.fai文件如下, 共5列, 分隔;

one 66 5 30 31
two 28 98 14 15


第一列 NAME : 序列的名称,只保留“>”后,第一个空白之前的内容;

第二列 LENGTH: 序列的长度, 单位为bp;

第三列 OFFSET : 第一个碱基的偏移量, 从0开始计数,换行符也统计进行;

第四列 LINEBASES : 除了最后一行外, 其他代表序列的行的碱基数, 单位为bp;

第五列 LINEWIDTH : 行宽, 除了最后一行外, 其他代表序列的行的长度, 包括换行符, 在windows系统中换行符为 , 要在序列长度的基础上加2;

提取序列:

samtools faidx input.fa chr1 > chr1.fa

samtools faidx input.fa chr1:100-200 > chr1.fa

PS:

引用:http://www.cnblogs.com/xudongliang/p/5200655.html

bwa  index   产生的是:

/*/Public_dir/Database/Human/Hg19_ref/bwaIndex/下的hg19.fasta.amb、hg19.fasta.ann、hg19.fasta.bwt、hg19.fasta.pac、区别samtools faid产生的.fai文件功能和bwa index 产生的四个文件的功能第1张hg19.fasta.sa四个文件.作用是为后续比对做准备。

 

免责声明:文章转载自《区别samtools faid产生的.fai文件功能和bwa index 产生的四个文件的功能》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇[K8s] Kubernetes 集群部署管理方式对比, kops, kubeadm, kubesprayOracle 性能调优 概述下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

samtools manu

SYNOPSIS samtools view -bt ref_list.txt -o aln.bam aln.sam.gz samtools sort -T /tmp/aln.sorted -o aln.sorted.bam aln.bam samtools index aln.sorted.bam samtools idxstats aln.sorted...

SAMTOOLS使用 SAM BAM文件处理

 【怪毛匠子 整理】 samtools学习及使用范例,以及官方文档详解 #第一步:把sam文件转换成bam文件,我们得到map.bam文件   system"samtools view -bS map.sam > map.bam";   #第二步:sort 一下 BAM 文件,得到map.sorted.bam   system"samtools so...