看教程不够直观,那就看视频吧! >>点击加载视频
在数据分析之前,通常需要先将数据标准化(normalization),利用标准化后的数据进行数据分析。数据标准化是将数据按照比例缩放,使之落入一个小的特定区间,数据标准化的方法有很多种,常用的有Z-score、分位数等。
1和2是选择输入数据的两种方式,1为导入单个表达矩阵,2可以同时导入多个矩阵(操作方法就是按住Ctrl即可)
3是四种标准化方法
TPM:适用于TCGA数据库;TPM的计算方法:
1)标准化基因长度:将所有基因的Read数除以基因长度(基因长度单位为kb);
2)计算总Read数:计算每一个样本的总Read数,然后将其换算为以百万位单位(M)
3)标准化总Read数:将所有基因的Read数除以总Read数;
Z-score:是基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化;
log2(x+1):log函数标准化很简单就不多说了
quantiles步骤:
1)对每张芯片的数据点排序;
2)求出同一位置的几次重复实验数据的均值,并用该均值代替该位置的基因的表达量;
3)将每个基因还原到本身的位置上。
那么最后就是操作起来更为简单,直接点击转换并导出,选择要出输出的目录,等待完成就好
最终生成结果为Meger*.txt的一个文件
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!