噬菌体(phage)是侵袭细菌的病毒,也是赋予宿主菌生物学性状的遗传物质。噬菌体必须在活菌内寄生,有严格的宿主特异性,其取决于噬菌体吸附器官和受体菌表面受体的分子结构和互补性。噬菌体测序过程中会有宿主菌污染,因此组装前需要去除宿主菌序列。
snakemake搭建流程(一)
Snakemake 是基于 Python 的一款工具,所以它也继承了 Python 语言简单易读、逻辑清晰、便于维护的特点,同时它还支持 Python 语法,非常适合新手用户。例如遵循python中缩进表示层级;以及索引从0开始,{input[0]}表示input里的第1个元素;列表用中括号类似[‘A’,’B’,’C’]等。snakemake 的基本组成单位叫“规则”,即 rule;每个 rule 里面又有多个元素(input、output、shell等)。它的执行逻辑就是将各个 rule 利用 input/output 连接起来,形成一个完整的工作流。
GEO
转录组之可视化
DESeq2筛选差异表达基因并注释
分子对接
RNA-seq R语言部分(表达矩阵合并及id转换)
RNA-seq第三部分(比对,比对质控,HTseq-count计数)
一.比对(hisat2)
1.构建索引
a.使用hisat2-build 命令自行构建(耗时长,不推荐)
1 | hisat2-build -p 4 hg19.fa genome |
hg19.fa为ucsc下载的基因组解压合并后的文件
-p 线程数
genome 生成的index前缀名
RNA-seq第二部分(基因组序列下载,注释文件下载)
ucsc下载基因组及GTF注释文件是较为简单且常用的,推荐使用ucsc下载。
一.参考基因组下载
1.有三大网站可以提供基因组下载,它们分别是:
1).NCBI (https://www.ncbi.nlm.nih.gov/grc)
2).UCSC (http://hgdownload.soe.ucsc.edu/downloads.html)
3).Ensemble (http://asia.ensembl.org/index.html?redirect=no)
三代测序
三代测序是指单分子测序技术(Single Molecule Real- Time, SMRT),在测序过程中不需要涉及PCR扩增,不仅实现了每一条DNA分子的单独测序,并且避免了潜在的PCR扩增错误和偏好性。
目前,三代测序技术原理分为单分子荧光测序和纳米孔测序两大阵营,其代表公司分别为Pacific Bioscience和Oxford Nanopore Technologies。现在市场接受度和使用度最高的是Pacific Bioscience三代测序仪,其SMRT技术建立在两项革命性的发明基础之上,从而克服了测序领域的重大挑战。