博客

生物信息学笔记7：对sam文件重新排序

通过hisat2比对得到sam文件，如果重复多次用同一个命令比对同一条序列，每次得到的sam文件其实是大小一样但内容顺序不同的文件，所以我们需要用软件进行重新排序。 read more

2018年11月19日
古人养生智慧与现代科学解释

今天就想到三点，后续想到什么再补充。

1、已饥方食，未饱先止。必须等到腹中觉得饥饿时，才可以进食，尚未吃得十分饱满，就应当停止。因为一定的饥饿能够促进生长激素的分泌，当然不能一直饥饿，一直饥饿连合成生长激素的原料都不够就不行了。 read more

2018年11月17日
快速减肥期间的饮食建议

1、起床，温水泡小麦苗粉3勺，虽然口感不太好，亲测对身体有好处，至少排便通畅，有一定抗炎效果。（网络上对小麦苗汁的作用褒贬不一，很多人甚至从起源上批判最早提出的那个“安博士”，也许很多地方都有夸大其词的地方，包括什么补血乱七八糟的，但是不能因此把这个好的功效也一棒子打死，也不能吹到天上去，各人根据需要自行判断） read more

2018年11月17日
关于减肥

瘦弱的人想变有肉，肉太多又想减肥。

我从小体质弱，但体育也还能过得去吧（特别是立定跳远始终是很牛逼的那种，哈哈身体轻，高中随便一跳就是2.65-2.7米），就是比较瘦、单薄，后来就想着能强壮点，补充牛奶等等，可好像也不长肉，后来逐渐意识到要锻炼、健身，所以到高中阶段就开始狂练肌肉，什么俯卧撑、哑铃、单杠、双杠全都炼，还练跳高摸天花板，长肌肉的效果确实显著，皮肤都撑开了（就是叫做生长纹，像妊娠纹的那种），到了大学渐渐变懒、又经常聚餐喝酒，胖起来自己照镜子都看不出来，看了照片和视频才发现：真的胖成一个球了。原来锻炼健身停下来是会变胖的，除非能控制住自己的食欲...... read more

2018年11月16日
生物信息学笔记6：hisat2比对生成sam文件

在上一步，我们建立了index，可以在运行index命令的目录（我是在dnaseq\chrX_data\third\index，这个dnaseq目录是win10和linux的共享文件夹，关于该共享文件夹可能有些人可能还会有点弯路要走，我一开始是在linux下面找不到这个共享文件夹，这个后面如果有时间我会专门写一篇）下找到相应的文件如下图（里面包括了chrX.exon和chrX.ss这两个从gtf文件中提取的，以及剩下的就是index文件，有1-8，但是在比对时用chrX_tran代表）： read more

2018年11月15日
新灰姑娘

不知道孩子会不会喜欢，经常每天晚上或者早上都来一句“爸爸，我要听公主的故事”、“我要听白雪公主的故事”、“我要听灰姑娘的故事”......

原来我是想让孩子先看《寻梦环游记》的（这是非常非常好的动画片，建议大家看），不过考虑到小孩这么喜欢公主，刚好又有这片子，如果影院新上也可以去影院看（就是怕太吵，然后晚上太晚小孩要睡觉，周末白天么又要去上早教，妈妈呀......从小时间就不够用，我都已经报班报的少了，主要就问她喜不喜欢，不喜欢一律pass，关键就是要让她多接触多玩，多和其他小朋友玩，从开心娱乐中成长）。 read more

2018年11月15日
生物信息学笔记5：用hisat2软件包建立基因组index

顾名思义，建立基因组索引，主要是提高比对的速度、效率，对剪切位点进行预测，hisat2建立基因组+转录组+SNP索引，so，为什么要建立索引：

高通量测序有成千上万条reads需要高效比对到参考基因组上，并且保证一定的准确率，答案不一定说完全正确，但一定要非常接近真实数据。需要根据参考基因组序列，经过一定算法（大部分情况是BWT或其改良算法）转换成index，把reads通过和index的比较过程进行回贴（maping到参考基因组），大幅度缩短比对maping的时间。（关于BWT算法，请参考：http://www.bio-info-trainee.com/?s=bowtie和http://www.biotrainee.com/thread-26-1-1.html，后期考虑转载过来学习以防链接失效） read more

2018年11月15日
mip改造pro插件中加入iframe转换功能

今天又发现有一条mip链接校验不通过，原因是iframe没有转换成mip-iframe，这个插件还是有待改进啊（i3geek不知道什么时候才会更新），还是自己动手、丰衣足食（当然我不后悔买了这个插件，毕竟基本功能在那里呢，自己改改代码也不要多少时间）。 read more

2018年11月14日
明堂

可以消遣消遣的一部韩国电影。

围绕“相地官”（片中是专为帝王看墓地风水）而展开的剧情，片子中有些地方很玄，但大部分的关于风水的道理其实大家都能理解，比如道路不好造成走的人不多、市场也热闹不起来，种一些绿色植物改善环境.......其实里面主要讲的还是宫斗，皇帝无能、奸臣专权、王孙篡位等都挤一起了，这么短的时间里面其实也不用太认真去深究里面的逻辑。 read more

2018年11月14日
生物信息学笔记4：hisat2的下载安装及环境配置

一、需要分析的序列，比如在samples文件夹里：

ERR188044_chrX_1.fastq.gz

ERR188044_chrX_2.fastq.gz

ERR188104_chrX_1.fastq.gz

ERR188104_chrX_2.fastq.gz

......

我就不一一列出来，这里列出来主要就是想说同一个序列有1和2，就是双端测序的意思 read more

2018年11月14日