他山之石可以攻玉:又能发SCI,毕业了!

《诗经》里有一句话一直广为流传。“他山之石,可以攻玉”,意思是别的山头的石头坚硬,可以琢磨玉器。 作为一只科研汪,在科研上,我们同样可以借用“别人山头的石头”,来琢磨“

《诗经》里有一句话一直广为流传。“他山之石,可以攻玉”,意思是别的山头的石头坚硬,可以琢磨玉器。


作为一只科研汪,在科研上,我们同样可以借用“别人山头的石头”,来琢磨“玉器”。这里的“他山之石”包括GEO, TCGA, Arrayexpress,SEER, TARGET等数据库里的数据,而“玉器”则是发表生信SCI文章,完成科研选题,顺利毕业,找工作,申请基金等)。


去年有一篇生信分析类文章发表在《BioMed Research International》(2017年影响因子为2.583)上。


今天,我带大家一起来学习下这篇文章的整个思路


研究背景:

骨肉瘤是一种常见的原发性骨肿瘤,患者预后较差。骨肉瘤患者经过化疗后容易引起耐药和肿瘤切除后复发。


研究目的:

找到与骨肉瘤耐药相关的miRNA和基因。


研究方法:

1、从GEO数据库中查找相关的芯片--GSE87437(基因表达芯片)和GSE30934(miRNA表达芯片)



2、通过GEO2R(GEO数据库的在线分析工具)对GSE87437这个基因表达芯片做差异分析,找到差异gene:422个上调基因,246个下调基因。


3、用Morpheus工具对获得的差异表达基因做分层聚类分析


4、为了进一步了解这些差异表达基因,随后做了GO功能注释和KEGG通路富集分析(DAVID)


找到的一些富集通路能为我们的机制研究提供思路和方向,能为我们提供后续的一些发散课题。


5、接着,作者进一步构建了蛋白互作网络(STRING 数据库),STRING数据库是目前一个比较常用的蛋白之间相互作用关系研究的工具。通过联合STRING数据库和Cytoscape软件中一些小插件(包括cytohubba,MCODE等),我们可以找到相应的功能蛋白模块以及枢纽基因。

构建蛋白互作网络图

结合Cytoscape软件中的MCODE插件,筛选PPI网络中的具有统计学意义的蛋白模块以及相应的枢纽基因。


6、利用GEO中另一个包含临床信息的芯片-GSE21257,对筛选出的9个枢纽基因进行生存预后分析。其中GPR180和CDK1两个基因没有在GSE21257这个芯片,因此没有做预后分析,并在文章中作出相应声明。其实还有很多其他预后数据库可以来验证筛选出的基因的预后作用,详见下回分解,哈哈哈~。



其他七个基因的预后情况如下:


截止到这里,基因表达数据库这一块内容大概已经完成了。在前面,我有提到作者还挖掘了另一个miRNA表达数据库,那么,作者是如何将这个芯片连接起来的呢?研究非编码RNA的大伙儿应该都知道,miRNA最经典的作用方式就是结合靶基因的3‘UTR,从而负向调控基因的表达. 这篇文章,作者就是通过miRNA-mRNA负向关系对,将基因表达芯片和miRNA表达芯片连接在一起.


7、首先,作者获得GSE30934芯片中差异表达的miRNA (同样是用GEO2R分析),最后得到5个显著差异表达的miRNAs

8、接着,利用miRWalk 1.0数据库,预测了这5个miRNA的潜在靶基因,并用Cytoscape软件作了如下的网络图.

9、进一步比对这些靶基因和之前分析出的差异表达基因,作者发现差异基因ZNRD1是miR-543的靶基因而CAT是miR-518f的靶基因,并且作者还发现这两个miRNA-mRNA关系对的负向表达关系是存在的.

 

如是,整篇文章就已经完成了.如果有实验条件,对最后筛选出的两个miRNA-mRNA关系对作实验验证,可能这篇文章就是4-5分水平了.至于作者为什么没做,我就不太清楚了.或许是因为他们没有相应的耐药骨肉瘤细胞株;又或许是他们只需要这个水平的文章;当然也有可能是因为他们做了实验但全是阴性结果,最后就没有展示.


最后,我想说的是,在寻找分析数据的时候,你得先想清楚你为什么要做生信分析?你的需求和目的是什么?我想大部分的人是想在发表文章的同时能开展后续的研究,那么你就得评估你自己目前有什么资源,包括肿瘤标本,实验室条件等.像这篇文章,理想的情况下就是你有骨肉瘤得耐药细胞.这样你就能开展后续的实验,发表更高质量的文章.当然,如果你只是做到生信分析这步为止的话,就无所谓了.初学的同学,可以到目前国内最大的生信学习社区(https://shengxin.ren/)逛逛,尤其是神秘的SangerBox可视化生信分析软件。


其实这篇文章的很多地方还能增加不少的内容,包括:筛选出的差异miRNA可以进一步用其他数据库预测其骨肉瘤中的表达以及预后;筛选出的枢纽基因的表达量也可以进一步用数据库验证;包括miRNA-mRNA关系队,可以联合多个预测数据库取交集等等.

 

加上以上分析,这篇文章就肯定不只是2分多而已!

这些分析都不是那么的难,并且我也已经录制了相应的视频课程<零基础,零代码发表4分生信SCI>供需要的同学学习,同时在视频中还原了一篇自己的生信章(IF=4.2).
目前活动期,只需要99元,一次购买,长期有效点击阅读原文,即可加入学习



科学自由共享

投稿请扔至:freescience@zju.edu.cn

未经许可 不得转载

长按二维码关注

转自:弗雷赛斯
  • 发表于 2018-11-21 13:26
  • 阅读 ( 252 )
  • 分类:转录组学

1 条评论

请先 登录 后评论
不写代码的码农
余繁荣

1 篇文章

作家榜 »

  1. 祝让飞 93 文章
  2. 刘永鑫 64 文章
  3. SXR 44 文章
  4. 调研图 36 文章
  5. 张海伦 31 文章
  6. 生信分析流 28 文章
  7. 爽儿 25 文章
  8. shengxinbaodian 16 文章