首页游戏攻略工具篇丨不想用R语言也想做通路分析?意见收躲这个万能网站!

工具篇丨不想用R语言也想做通路分析?意见收躲这个万能网站!

misa2 03-13 4次浏览 0条评论

撰写:米妮 来源:小张聊科研平台的“ i生信”公众号,微信公众号搜索“ i生信”即可关注/扫描关注见文末

#生信分析# #生信发文# #数据库#

不会使用R语言也想快速做感兴致基因列表的通路分析那就赶紧来使用这个CPA网站吧:

为什么说“共识”通路分析呢?因为此网站可以做多数据集与多种方法分析,共识分析目的是让用户可以探索多种分析的结果,包括不同数据集的结果以及不同方法的结果。

打开和我一起来,富集通路快速到手!

图1

图1A展示了使用 CPA 的分析会话的整体工作流程。总体而言,分析由三个主要模块组成:数据输进、参数设置、分析和可视化。对于输进数据,用户可以抉择从本地输进基因列表、基因列表及其倍数转变或基因表达矩阵。界面的设计使用户可以灵巧地分析自己的数据。还支持从 NCBI Gene Expression Omnibus (GEO) 导进数据。在参数设置中,用户可以抉择感兴致的途径(GO / KEGG),分析方法和方法参数。最后,图1B展示了示例可视化和分析结果;在分析和可视化模块中,用户可以可视化和交互式地探索和导出分析结果。图1B展示了PCA平台生成的示例可视化和可获取的图表。其中包括:样本landscape(t-SNE)、火山图、基因热图、通路连通性图和基因作用网络。

展开全文

在以下各节中详尽介绍这些模块中的每一个:

数据输进

CPA 平台支持三种不同类型的输进,包括 (i) 差异表达 (DE) 基因列表、(ii) 基因及其倍数转变 (iii) 表达矩阵。前两种输进类型可以直接在网站上输进,也可以从用户本地机上传为 .txt 或 .tsv 文件,其中每一行代表一个基因。对于表达式矩阵输进,一个数据集可以由两个 .csv 文件表达——一个用于表达式矩阵,一个用于样本分组。样本分组文件有两列,其中第一列包括样本,第二列是它们对应的组(例如对比或疾病)。样本分组文件是可选的,假如未提供,用户需要在 GUI 中手动抉择对比和疾病样本。该平台还支持从其他基因标识符到Entrez ID的ID转换。

CPA 还提供了易于使用的文件治理器,供用户上传和治理表达式数据(上传、删除、重命名和下载)。用户可以从本地机器上传表达数据文件,也可以从 NCBI GEO 导进。匿名用户上传和导进的文件将在 24 小时后删除。登录 CPA后可以永久保存数据并跨多个设备访问存储的分析会话。

通路分析的参数设置

图 2

图2展示了通路分析的 GUI,其中用户可以为分析会话抉择一个或多个数据集。对于每个数据集,用户可以从下拉列表中抉择输进类型。当用户抉择提供DE基因列表(gene list)时,可以使用ORA/Webgestalt进行分析。抉择基因和fold转变时,Wilcox-Test,Ks-Test和FGSEA可用于分析。当用户提供表达矩阵时,所有八种通路分析方法均可用于分析:GSEA、GSA、FGSEA、PADOG、Impact Analysis、ORA/WebGestalt、KS-test 和 Wilcox-test。这8种方法。它们中的每一个都旨在找到不同的数据模式。但通过多种方法识别特定途径并不一定使其在生物学上更具意义。

目前,CPA 支持对多种的生物体进行分析。用户还可以以 GMT 文件格式上传其他数据库的通路注释。抉择数据、通路和方法后,用户只需单击“开始分析”按钮即可开始分析。

分析和可视化

图 3

分析完成后,网站会展示通路连接图(图 3A),其中节点代表通路,边表达连接通路共享数量的基因。在这个通路图中,节点的大小与通路中的基因数量成正比,而边界宽度与 DE 基因的总数成正比。如图所示,每个节点被分成多个切片,代表多次分析的结果。例如,具有三个数据集的三个方法的分析会话共有九个切片(九个分析)。用户可以改变显著性阈值(P值)。并且仅当路径至少在一项分析中显著时才会出现节点。假如通路在相应的分析中具有显著的P值,则切片被着色。在图 3A 中,黑色窗口展示了阿尔茨海默病通路的P 值。该途径的所有九个P 值都是显着的,因此所有切片都是彩色的。相比之下,肌萎缩性侧索硬化途径具有白色切片,因为其中一种分析的P值不显着。

通路图随附的通路表展示了每个路径的基本信息:ID、描述、基因数量以及在所有分析中获得的P 值(图 3B)。使用此表的可编辑字段,更改显著性阈值、可以隐躲不需要的路径或添加感兴致的路径来个性化修改。

还支持通路可视化。当用户右键单击路径图的节点时,可以抉择展示 KEGG 路径(图 3D)。在演示中,每个节点都是一个复合体。由于KEGG通路中的每个节点往往包含多个基因,因此每个部分的颜色反映了该节点中所有基因的平均FC。默认情状下,也将节点所有基因的P值组合起来,得到一个组合P值。用户可以依据这个组合的P值抉择给节点着色。用户还可以从可视化中删除任何不需要的数据集。当用户点击一个 KEGG 节点时,他们可以看到属于该节点的基因。

在探索分析结果时,用户可以将任何图形导出为标量图(.png) 或矢量图 (.svg) 。他们还可以将通过差异分析获得的结果、基因信息和来自通路分析的P值导出为.csv文件。通路分析页面中的其他图(例如示例landscape、火山图等)可以导出为标量图 (.png)。

走实例一起用!

在此示例会话中,我们分析了三个阿尔茨海默氏症数据集:GSE5281、GSE84422和 GSE48350。三个数据集总共 66 个对比样本和 57 个疾病样本组成。

每个数据集都使用三种方法默认参数进行分析(ORA、KS-test 和 FGSEA)。对于每个分析,显著性阈值设置为F D R 5%FD。得到来包括了 335 个 KEGG 通路和 2508 个 GO 术语。在全局通路连接图中,总共有 2843 个节点——每个节点表达为一个KEGG或 GO 术语。图4展示了重要节点获得的子网。抉择模块中的节点,设置每个路径至少在五次分析(共九次分析)中表现为显著。

图 4

得到来与神经退行性疾病相关的 5 条通路——多种疾病、阿尔茨海默病、亨廷顿病、帕金森病和朊病毒病,在所有九个分析中均一致被认定为显著。

为确定可能在五种神经退行性疾病通路失调中发扬重要作用的基因。使用该网站,接下来进行了基因水平分析,使用以下基因交集:(i) 属于所有五种途径(ii) 在所有三个数据集中差异表达。图5A展示了所得 21 个 DE 基因的热图。这些基因中的大多数都与线粒体、蛋白酶体和微管相关。图6B展示了这些基因与阿尔茨海默病通路的哪些成分直接映射。

图 5

这样一个共识通路就到手了,输进你感兴致的数据,一起来试试!

原文链接:

fc坦克大战下载
情人节送礼精选:畅玩Xbox平台游戏,盖世小鸡X2 Pro手柄评测揭秘 免驱双模新抉择,雷柏V600S游戏手柄
相关内容
发表评论

游客 回复需填写必要信息