Find Elephant

标签： index

生物信息学笔记6：hisat2比对生成sam文件

在上一步，我们建立了index，可以在运行index命令的目录（我是在dnaseq\chrX_data\third\index，这个dnaseq目录是win10和linux的共享文件夹，关于该共享文件夹可能有些人可能还会有点弯路要走，我一开始是在linux下面找不到这个共享文件夹，这个后面如果有时间我会专门写一篇）下找到相应的文件如下图（里面包括了chrX.exon和chrX.ss这两个从gtf文件中提取的，以及剩下的就是index文件，有1-8，但是在比对时用chrX_tran代表）： read more

2018年11月15日
生物信息学笔记5：用hisat2软件包建立基因组index

顾名思义，建立基因组索引，主要是提高比对的速度、效率，对剪切位点进行预测，hisat2建立基因组+转录组+SNP索引，so，为什么要建立索引：

高通量测序有成千上万条reads需要高效比对到参考基因组上，并且保证一定的准确率，答案不一定说完全正确，但一定要非常接近真实数据。需要根据参考基因组序列，经过一定算法（大部分情况是BWT或其改良算法）转换成index，把reads通过和index的比较过程进行回贴（maping到参考基因组），大幅度缩短比对maping的时间。（关于BWT算法，请参考：http://www.bio-info-trainee.com/?s=bowtie和http://www.biotrainee.com/thread-26-1-1.html，后期考虑转载过来学习以防链接失效） read more

2018年11月15日

标签： index

生物信息学笔记6：hisat2比对生成sam文件

生物信息学笔记5：用hisat2软件包建立基因组index