外显子分析:cutadapt,去除序列adapter详细解析

摘要:
“-aFIRST...SECOND”该参数能去除首末端分别有FIRST和SECOND的adapter,即使是不完整的SECONDadapter也是允许的,如第二列。然而,当序列没有FIRST首端adapter序列时,则无法去除。

外显子测序时带有adapt接头,因此我们需要去除adapt接头,cutadapt的作用是去除adapt接头,一般用到如下命令:

cutadapt -a AACCGGTT -o output.fastq input.fastq

“-a”参数表明后面跟着的“AACCGGTT”是我们想要去除的adapt接头,如果你的外显子接头为其他序列,请将“AACCGGTT”改为你想去除的adapt接头;

“-o”参数后面跟着的是输出文件“output.fastq”;

“input.fastq”指的是输入文件;

输入文件必须是以下三种格式文件:

  • FASTA (文件名后缀:.fasta,.fa,.fna)
  • FASTQ (后缀:.fastq,.fq)
  • 以上任何一种, 但压缩为.gz(甚至.bz2.xz都是允许的).

如果输入文件以.gz 为后缀的话,则去除adapt的命令为:

cutadapt -a AACCGGTT -o output.fastq.gz input.fastq.gz

如果通过“-o”没有输出指定文件,也可以用以下命令输出文件:

cutadapt -a AACCGGTT input.fastq > output.fastq

下图是用不同参数去除不同的adapt,左列是对adapt的描述,右列是我们去除该行对应的adapt时选择的参数:  

外显子分析:cutadapt,去除序列adapter详细解析第1张

图来源(https://cutadapt.readthedocs.io/en/stable/guide.html)

下图是去除不同adapt时,剪切掉的序列范围模式图:

外显子分析:cutadapt,去除序列adapter详细解析第2张

图来源(https://cutadapt.readthedocs.io/en/stable/guide.html)

对于不同的adapter和命令,去除效果如下:

"-a ADAPTER"去除ADAPTER后面所有的序列,即使是不完整的ADAPTER也可以去除,如ADAP

外显子分析:cutadapt,去除序列adapter详细解析第3张

"-g ADAPTER"去除ADAPTER之前所有的序列,包括ADAPTER自己,即使是不完整的ADAPTER也可以,如DAPTER、TER

外显子分析:cutadapt,去除序列adapter详细解析第4张

“-a ADAPTER$”在adapter上加$只能去除有完整的ADAPTER,且该ADAPTER在3’末端,后面不加任何其他序列,如下图第三列用该参数时不能被去除。

外显子分析:cutadapt,去除序列adapter详细解析第5张

“-a FIRST...SECOND”该参数能去除首末端分别有FIRST和SECOND的adapter,即使是不完整的SECOND adapter也是允许的,如第二列。然而,当序列没有FIRST首端adapter序列时,则无法去除。

外显子分析:cutadapt,去除序列adapter详细解析第6张

Ps:如果一条序列含有多个相同的adapter,则系统默认处理最左边的adapter,如“cccccADAPTERgggggADAPTERttttt”,当搜寻3‘ adapter时,序列修剪成“ccccc”,当搜寻5’ adapter时,序列修剪成“gggggADAPTERttttt”。

免责声明:文章转载自《外显子分析:cutadapt,去除序列adapter详细解析》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇Promise.then链式调用顺序节点操作--JavaScript下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

iOS,QRCord(矩阵二维码)

1.二维码及其原理介绍 2.二维码生成 3.二维码解析 二维码及其原理介绍 二维条码是指在一维条码的基础上扩展出另一维具有可读性的条码,使用黑白矩形图案表示二进制数据,被设备扫描后可获取其中所包含的信息。一维条码的宽度记载着数据,而其长度没有记载数据。二维条码的长度、宽度均记载着数据。二维条码有一维条码没有的“定位点”和“容错机制”。容错机制在即使没有辨识...

Axios源码阅读笔记#1 默认配置项

Promise based HTTP client for the browser and node.js 这是 Axios 的定义,Axios 是基于 Promise,用于HTTP客户端——浏览器和 node.js 的库 。Github:https://github.com/mzabriskie/axios。 官方文档中 Axios 的 feature...

linux查看cpu温度

    分类: linux系统 一、安装   sudo apt-get install lm-sensors   二、查看 linux@cdyemail:~$ sensors k10temp-pci-00c3 Adapter: PCI adapter temp1:        +33.6°C  (high = +70.0°C)         ...

Linux FTP基本操作命令 ( 序列二 ftp)

1.登陆ftp服务器 ftp [IP] [PORT] # 登陆ftp服务器,本机登陆可以不写IP实例: [root@ftpsrv vsftpd]#ftp 127.0.0.1 21 Connected to 127.0.0.1 (127.0.0.1). (vsFTPd 2.2.2) Name (127.0.0.1:root): nice Ple...

C# LINQ学习笔记二:LINQ标准查询操作概述

本笔记摘抄自:https://www.cnblogs.com/liqingwen/p/5801249.html,记录一下学习过程以备后续查用。 “标准查询运算符”是组成语言集成查询 (LINQ) 模式的方法,大多数这些方法都在序列上运行,其中的序列是一个对象,其类型实现了IEnumerable<T>接口 或 IQueryable<T&g...

隐马尔科夫模型(HMM)及事实上现

马尔科夫模型 马尔科夫模型是单重随机过程,是一个2元组:(S,A)。 当中S是状态集合,A是状态转移矩阵。 仅仅用状态转移来描写叙述随机过程。   马尔科夫模型的2个如果 有限历史性如果:t+l时刻系统状态的概率分布仅仅与t时刻的状态有关,与t时刻曾经的状态无关; 齐次性如果:从t时刻到t+l时刻的状态转移与t的值无关。   以天气模型为例 天气变化有3...