在线作图丨数据降维方法③——正交偏最小二乘方判别分析(OPLS-DA)

Question1:什么是PLS-DA?

与PCA不同,PLS是“有监督”模式的偏最小二乘法分析,也就是在分析数据时,已知样本的分组关系,这样可以更好的选择区分各组的特征变量,确定样本之间的关系。DA是判别分析,PLS-DA用偏最小二乘回归的方法,在对数据“降维”的同时,建立了回归模型,并对回归结果进行判别分析。
OPLS-DA是在PLS-DA的基础上,进行了正交变换的矫正,可以滤除与分类信息无关的噪音,提高了模型的解析能力和有效性。

Question2:什么是OPLS-DA?

OPLS是一种多因变量对多自变量的回归建模方法,其最大的特点是可以去除自变量X中与分类变量Y无关的数据变异,是分类信息主要集中在一个主成分中,从而模型变的简单和易于解释,其判别效果和主成分得分图的可视化效果更加明显。正交偏最小二乘法判别分析(orthogonal partial least-squares discrimination analysis,OPLS-DA)在代谢组学分析中应用较多,利用偏最小二乘回归建立代谢物表达量与样本类别之间的关系模型,同时还可以有效分离样本,预测样品类别。
PLS-DA/OPLS-DA建立了代谢物表达量与分组关系之间的模型,PLS-DA/OPLS-DA可以更好地获取组间差异信息,还可以对样品的分组进行预测,这是PCA做不到的。

Question3:如何不使用R语言在线绘制OPLS-DA图?

云图图(https://www.cloudtutu.com/#/index),操作步骤如下:

①登录网址:https://www.cloudtutu.com/#/index(推荐使用360或者谷歌浏览器)

②输入用户名和密码(小编已经为大家填好了,如果不显示可添加文末二维码添加小编获取),输入验证码后即可登录,无需注册,直接使用,不必担心隐私泄露,是不是诚意满满~

③登录后在工具一栏(全部分析)里找到OPLSDA分析,点击进入;

④请按照界面右侧的说明书或者下文进行操作,即可在2分钟内获得一张精美的OPLS-DA分析图喽~

话不多说,我们开始行动吧~

Step 1 上传数据

※目前平台仅支持.txt(制表符分隔)文本文件或者.csv文件的文件上传。
平台可对不规范的数据格式进行部分处理,但还是请您尽量按照示例数据的格式调整数据,以便机器可以识别。
a)准备一个数据矩阵(形式参照示例数据,如微生物OTU表、物种丰度表、基因表达量矩阵、代谢物含量表,也可以是测量数据,例如身高、体重、表型等);
b)表格需要带表头和列名,第一行为样本名,第一列为各种指标名(如代谢物名称、OTUID、genus等)。
c)请提交txt(制表符分隔)文本文件或者.csv文件。操作方法为:全选excel中的所有内容(ctrl+A),复制到记事本中,将记事本文件另存后上传该文件。
](https://upload-images.jianshu.io/upload_images/26236226-a5571187c26fb1f9?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
※传完文件后一定要填写说明书下方的分组信息!

Step 2 设置参数
2.1 在界面右侧编辑分组信息:需要对所有样品进行分组,本网站支持在线修改分组名称和样品名称的功能。

image

2.2筛选显示种类:按需自行选择要用的样本进行作图
image

2.3 方法选择:OPLS_DA(正交偏最小二乘回归分析)、PLS_DA(偏最小二乘回归分析)
2.4选择比较组:OPLSDA仅支持两组数据进行分析。
2.5横纵坐标字体大小:按需求自行设置
2.6元素大小:图中显示的元素图形大小
2.7是否添加椭圆:图例如下
椭圆一:按照正常计算方式得到分组椭圆(有些结果可能加不上分组椭圆)
椭圆二:强行添加分组椭圆。
否:不添加分组椭圆
image

2.8 椭圆粗细:按需自行设置
2.9 是否显示标签:是、否
2.10 标签大小:按需自行设置

Step 3 下载文件
根据个人需求进行参数调整后点击运行后等待5-10秒即可下载结果,平台提供PDF格式的矢量图下载。表格文件可用于后续分析。

Step 4 作图后处理

TUTU云平台提供的是PDF格式的矢量图,可通过矢量图处理软件(Inkscape或AI)进行编辑和调整(如:文字字体,文字大小,图片分辨率等)。图形处理软件和使用方法可扫描文后的二维码添加小编微信获取。

写作建议

OPLS-DA was performed on Tutools platform (http://www.cloudtutu.com), a free online data analysis website. The multilevel OPLSDA scores (tW 1, tW 2) of the within subject variation in simulated data on the first two components. The red squares represents the subjects in the control group. The blue circles represents the same subjects after the treatment. (参考文献:Multivariate paired data analysis: multilevel PLSDA versus OPLSDA)

你可能感兴趣的:(在线作图丨数据降维方法③——正交偏最小二乘方判别分析(OPLS-DA))