双疾病纯生信阐发6分+WGCNA和机器进修判定诊断基因+关键信号通路
尔云间 一个专门做科研的团队
存眷我们
不蹭热点若何轻松发纯生信?
双疾病绝对是不贰之选~
还能够阐发现成的两种疾病合并数据!
小云之前给各人分享过多篇双疾病的研究构想,小哥内容都是相对简单且常规,但影响因子丝毫不差。
但之前的双疾病构想都是别离阐发单个疾病的DEGs,再取交集得到双疾病相关的基因。
假设数据库间接有现成的两种疾病合并的数据,间接阐发岂不是得来全不费时间嘛~
(想晓得你存眷的疾病能否能够做双疾病构想?数据库能否有现成诗句?阐发内容若何晋级?快来评估吧!)
展开全文
今天小云要分享的那篇纯生信小哥,就是间接操纵数据库中两种疾病合并的数据停止阐发。亮点是操纵WGCNA+机器进修阐发了两种疾病合并的诊断基因,评估其诊断价值,增加临床意义。别的还操纵单基因GSEA阐发出了关键的信号通路。快和小云一路来看看吧!
标题问题:WGCNA和机器进修的综合阐发确定了扩大型心肌病合并心力弱竭的诊断生物标记物
杂志:Frontiers in cell and developmental biology
影响因子:6.081
颁发时间:2023年3月
数据信息
研究构想
从GEO数据库中下载扩大型心肌病(DCM)合并心力弱竭(HF)的数据集,摘用加权基因共表达收集阐发(WGCNA),在模块中判定出15个与DCM和HF高度相关的基因。对关键基因停止LASSO和机器进修,挑选出3个关基因用于诊断DCM合并HF。单细胞RNA-seq阐发进一步证明了关键基因在DCM患者心肌细胞中不变的上调表达。此外,通过GSEA发现TGF-β信号通路与关键基因相关,是DCM合并HF的潜在机造。
次要研究成果
1
阐发扩大型心肌病(DCM)合并心力弱竭(HF)中的
差别表达基因(DEGs)
阐发一般心肌样本(比照组)和DCM合并HF患者心肌样本(DCM合并HF组)间的差别表达基因。
图1 阐发DEGs
2
上调DEGs的生物学功用、路子和相关疾病
别离停止了GO、KEGG和DO富集阐发,以正文135个上调的DEGs的潜在功用、路子和疾病。此中NPPA做为核心基因,表达量高,边数多,表白其在肌肉收缩中具有新的感化。
图2表达上调的DEGs的潜在生物学功用、路子及相关疾病
3
加权基因共表达收集的构建
操纵WGCNA构建基因共表达收集,识别临床特征相关模块。此中ME蓝模块与DCM与HF呈强正相关,获得模块中的15个关键基因。
图3 DCM伴HF相关模块关键基因的判定
4
基于13个特征基因构建BP神经收集(BPNN)与验证
拔取ME蓝模块中的15个关键基因与135个上调的DEGs取交集做为DCM伴HF的特征基因,共得到13个基因。基于那13个基因构建一个BPNN,BPNN具有较高的揣测精度,操练组AUC评分为0.988。
图4基于13特征基因的BPNN构建与验证
5
挑选DCM合并HF的关键基因
为了缩小特征基因的范畴,停止Lasso,从13个特征基因中保留了5个基因。基于那5个基因成立5个机器进修模子(RF、GBM、NN、XGBoost和SVM),并验证其分类性能。此中3个基因(OMD、PRELP、NPPA)做为诊断DCM伴HF的关键基因。
图5获得DCM合并HF诊断的关键基因
6
验证关键基因对DCM伴HF具有诊断才能
阐发关键基因mRNA表达程度,并通过AUC评估它们的诊断才能。
图6操练组和试验组关键基因的差别表达及诊断准确率
7
单细胞RNA-seq阐发关键基因在DCM患者中表达上调
阐发比照组和DCM组的细胞群,在比照组和DCM组别离标注了三种差别的心肌细胞类型。然后,我们阐发关键基因在比照组和DCM组心肌细胞中的表达。发现与比照组比拟,DCM大大都心肌细胞中关键基因的表达程度较高。
图7 单细胞RNA-seq阐发关键基因在DCM患者中表达上调
8
NPPA、OMD和PRELP可能参与TGF-β信号通路在DCM合并HF中的感化
为了深进领会NPPA、OMD和PRELP的潜在通路,对每个基因停止了GSEA。此中TGF-β信号通路是NPPA、OMD和PRELP最可能参与的机造。然后,别离阐发了NPPA、OMD和PRELP与TGF-β信号通路基因集的Pearson相关性,取交集得到关键的TGF-β信号通路相关基因,将关键基因在在TGF-β信号通路中停止可视化。揣度与NPPA、OMD、PRELP呈正相关的TGF-β信号通路可能在HF合并DCM的过程中起关键感化。
图8 DCM伴HF中关键基因调控的潜在通路
总结
那篇小哥基于WGCNA和机器进修确定了诊断DCM伴HF的3个关键基因,还发现了关键的TGF-β信号通路可能是参与DCM合并HF的关键机造。别的还操纵单细胞数据验证了关键基因在心肌细胞中的表达上调。
双疾病的效果是1+1>2,简单的生信阐发就能让影响因子翻倍。你还不来尝尝吗?并且目前已颁发的双疾病生信小哥并没有什么高难度阐发手段,简简单单常规阐发也能够发文,非肿瘤疾病之间能够用,非肿瘤和肿瘤间能够用,原发疾病和并发症之间能够用,用处相当普遍。
别的,假设数据库间接有现成的两种疾病合并的数据,间接阐发岂不是愈加轻松嘛~假设你也对双疾病感兴致或者想要对构想立异晋级能够来找小云聊聊哦!
往期选举
干嘛伤磕一种疾病,穿插合成才是王道!8+ Frontiers系列的双疾病纯阐发小哥,让您跳出内卷,run出来!(私信获取)
体味分享!你想晓得的双疾病纯生信阐发的相关问题都在那里了,定见收躲!
别只盯着铁伤亡、铜伤亡了,快来看看那个典范又热门的标的目的,你的下一篇生信小哥可能就是它了!
一篇Science引出一个潜在生信热点— —动做淋凑趣构(TLS),立异性高、生信发文空间浩荡
,看到就是赚到!
若何从Nature小哥根究并构成我们本身的生信阐发构想?那套独家秘籍随便不过传!
震动!5张图就能搞定一篇8分+Frontiers生信阐发小哥!基于免疫细胞的阐发又添新成员
,那个构想万万不要错过!
双疾病纯生信阐发6分+WGCNA和机器进修判定诊断基因+关键信号通路