Sam&bam文件格式详解
Sam&bam文件格式详解 在SAM输出的结果中每一行都包括十二项通过Tab分隔(\t),从左到右分别是: 1 QNAME,序列的名字(Read的名字) 2 FLAG, 概括出一个合适的标记,各个数字分别代表 1 序列是一对序列中的一个 2 比对结果是一个pair-end比对的末端 4 没有找到位点 8 这个序列是pair中的一个但是没有找到位点 16 在这个比对上的位点,序列与参考序列反向互补 32 这个序列在pair-end中的的mate序列与参考序列反响互补 64 序列是 mate 1 128 序列是 mate 2 假如说标记为以上列举出的数目,就可以直接推断出匹配的情况。假如说标记不是以上列举出的数字,比如说83=(64+16+2+1),就是这几种情况值和。 3 RNAME,参考序列的名字(染色体) 4 POS,在参考序列上的位置(染色体上的位置) 5 MAPQ, mapping qulity 越高则位点越独特 bowtie2有时并不能完全确定一个短的序列来自参考序列的哪个位置,特别是对那些比较简单的序列。但是bowtie2会给出一个值来显示这个段序列来自某个位点的概率值,这个值就是mapping qulity。Mapping qulity的计算方法是:Q=-10log10p,Q是一个非负值,p是这个序列不来自这个位点的估计值。 假如说一条序列在某个参考序列上找到了两个位点