一、差异分析
差异基因是指一个基因在两个条件中表达水平的检测值在排除实验、检测等因素外,达到一定的差异,具有统计学意义,同时也具有生物学意义的显著表达差异的基因。差异表达分析的目的:识别两个条件下表达差异显著的基因,即一个基因在健康组样本和疾病组样本这两个条件中的表达水平,在排除各种偏差后,其差异具有统计学意义。研究癌基因的差异表达,一方面可以找出特定药物的靶标基因,另一方面可以为特定的靶标提供强有力的证据。
二、方法
利用Array Tools, DChip, SAM, MEV, R包limma、affy、marray、Matlab等方法计算获得差异表达基因。microarray一般用t检验,ANOVA分析,最常用limma进行检验。对RNA-Seq 行R包,如DESeq,DESeq2。
筛选标准:
1.倍数分析(通过基因表达的倍数变化阈值筛选差异基因)
2.采用统计分析中的 t 检验和方差分析(通过置信度筛选差异基因)
3.建模的方法,如贝叶斯方法。(通过B值筛选差异基因)
需要的数据:基因表达原始数据或者表达矩阵。
返还的结果:具有统计学意义的差异表达基因。如有需要可进一步提供差异基因注释、差异基因功能富集、蛋白互作网络等分析。