经系统检测,您当前使用的浏览器可能不符合交互需求。

为获得更好的交互体验,推荐您使用以下浏览器。

Firefox

点击下载

Chrome

点击下载

返回
动植物基因组分析

1、变异检测

检测测序样品与参考基因组之间的变异;或测序样品之间的变异。

 

2、数据质控(QC)

对原始测序数据进行初步的质量检查,并去除接头、低质量的碱基等。

 

3、参考基因组比对(mapping)

将短片段的测序数据在允许一定错配的情况下比对到长片段的参考基因组上。

 

4、 测序深度(depth)

比对到某个碱基上的测序reads个数。

 

5、基因组覆盖度(coverage)

参考基因组上被测序reads比对上的碱基百分比。

 

6、  Fastq格式

记录测序reads的碱基及其质量分数的文件格式。如下图所示,FASTQ格式以一个read为单位进行存储,每个read占4行,其中第一行和的第三行由文件识别标志(sequence identifiers)和读段名(ID)组成(第一行以“@”开头而第三行以“+”开头;第三行中ID可以省略,但“+”不能省略),第二行为碱基序列,第四行为对应位置碱基的测序质量分数。

 

7、  测序质量分数

用于表示每个碱基的测序质量,目前通用的测序质量分数为Phred33格式,其中每个字符对应的ASCII值减去33,即为对应的测序质量值。一般地,碱基质量从0-41,即对应的ASCII码为从“!”(0+33)到“J”(41+33)。如果测序错误率用E表示,Illumina HiSeqTM的碱基质量值用Q表示,则有下列关系:

Q=-10log10(E) 

测序错误率E:即每个碱基测序错误的概率。

 

8、PCR-duplication

二代测序的建库过程中使用了PCR技术,若有两条序列是由PCR产生的完全一致的序列被当做不同的reads被测序,则这两个reads互为PCR-duplication。

 

9、SNP:

即单核苷酸多态性(single nucleotide polymorphism,SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性,是基因组上多态性最高的遗传变异之一。

 

10、转换(Transition)

同种类型碱基之间突变称为转换,如嘌呤与嘌呤之间、嘧啶与嘧啶之间的变异。

 

11、颠换(Transversion)

不同类型碱基之间的突变,如嘌呤与嘧啶之间的变异。颠换的几率一般小于转换。

 

12、InDel

即插入/缺失(Insertion/Deletion),指基因组水平上的短片段插入或缺失所引起的DNA序列多态性。

 

13、染色体结构变异(SV)

长度在数Kb至数Mb的染色体变异,类型包括:缺失(DEL,deletions)、插入(INS,insertion)、倒位(INV,inversion)、染色体内部的易位(ITX,intra-chromosomal translocation)和染色体之间的易位(CTX,inter-chromosomal translocation)。


14、拷贝数变异(CNV)

拷贝数变异(Copy number variations,CNV),是由基因组发生重排而导致的,一般指长度为1kb以上的基因组大片段的拷贝数增加或者减少。

 

15、同义与非同义突变

对于位于外显子区域的突变,引起基因编码蛋白的氨基酸序列改变的突变称为非同义突变,反之则为同义突变。

 

16、BSA

即集群分离分析法(bulked segregant analysis),是指利用目标性状存在差异的两个亲本构建家系,在子代分离群体中,选取目标性状个体构建DNA混合池进行分析的方法。

微信扫一扫

//统计代码