迈杰转化医学研究(苏州)有限公司

杰论系列 | 上车!生信小白零代码也能做肿瘤免疫微环境分析
来源: 时间:2024-05-16


一、什么是肿瘤免疫微环境



肿瘤免疫微环境(tumor immune microenvironment,TIME)由B细胞、T细胞、巨噬细胞、树突状细胞、 中心粒细胞 、肿瘤相关成纤维细胞以及分泌的细胞因子等共同组成。肿瘤细胞与TIME的相互作用与肿瘤发生,发展和转移息息相关。基于下一代测序技术(next generation sequencing,NGS)依据各类型细胞的基因表达特征,我们可以通过生物信息学手段分析转录组样本中各类型免疫细胞丰度。但作为生信分析流程中的一环,TIME分析通常由专业的生信分析人员编写代码完成,具有一定的技术门槛。本文中,迈杰生信老司机将介绍几个适合非生信人员的在线分析工具,带你实现零代码TIME分析。


二、制作TIME分析输入文件

TIME分析需要基因表达矩阵文件作为输入,每一行为一个基因在各样本中的表达量,每一列为一个样本的基因表达集合。第一列为基因名(gene symbol形式),基因名不能有重复,第一行为需要分析的样本的名称,即样本ID,一般为字母或字母与数字的组合。通常TME在线分析工具仅接受文本格式文件输入,我们可以使用EXCEL等软件制作基因表达矩阵后,将内容拷贝至txt格式的文本文档(windows电脑中的那个“记事本”)中上传,若直接上传EXCEL文件则可能报错。基因表达量数值需要标准化处理,如 FPKM ,RPKM,RSEM或TPM。若只有counts数据,可以在EXCEL进行简单的标准化处理:每个基因的counts数除以该样本的总counts数,再乘以一个固定的系数(例如乘以1000000,否则表达量的小数位数过多)。


20210705143929001060/resource/images/ba3a887fe31a48bea1307309f2156d14_2.jpg

图1. 基因表达矩阵在EXCEL中的示例


如何得到基因的表达量呢?TCGA,GEO等公共数据库包含许多研究文献所对应样本的基因表达量数据,也可以委托测序公司对自己研究课题所采集的RNA样本进行转录组测序分析得到表达量。

我们以GEO数据库GSE256047数据集(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE256047)为例,该数据集在“Supplementary file”处提供了标准化的表达量文件,并且已符合表达矩阵格式,可直接使用,若遇到不符合格式要求的数据集则需要自己动手制作成相关格式。有些数据集未提供基因表达量集合,则需要在“Sample”处依次进入各样本信息页收集表达量。


20210705143929001060/resource/images/ba3a887fe31a48bea1307309f2156d14_4.jpg

图2. GSE256047数据集基因表达量结果下载


三、
EcoTyper
 

https://ecotyper.stanford.edu
EcoTyper[1] 为一款基于机器学习的分析工具,支持全转录组,单细胞转录组的基因表达量数据分析。EcoTyper目前有carcinoma和lymphoma两种分析模式。我们以carcinoma为例:


20210705143929001060/resource/images/ba3a887fe31a48bea1307309f2156d14_6.jpg

图3. EcoTyper界面


进入分析界面后,选择“Run EcoTyper”,随后点击”Browse”按钮选择基因表达矩阵文件上传,点击黑色按钮运行计算。


20210705143929001060/resource/images/ba3a887fe31a48bea1307309f2156d14_8.jpg

图4. EcoTyper分析示例


分析结束后,网页自动生成结果文件及图片,图片包括各类型免疫细胞比例热图,点击“Download Results”可下载分析结果。

20210705143929001060/resource/images/ba3a887fe31a48bea1307309f2156d14_10.jpg

图5. EcoTyper在线结果示例


下载的结果文件包含2个结果文件夹,对应不同的结果类型:


20210705143929001060/resource/images/ba3a887fe31a48bea1307309f2156d14_12.jpg

图6. EcoTyper下载结果示例



四、
 xCell





https://comphealth.ucsf.edu/app/xcell
xCell [2] 是一款基于ssGSEA算法的分析工具,其特点在于使用了多种细胞的多种表达特征作为依据,能够计算样本中64种细胞类型的丰度,为目前在线分析软件中细胞种类最多的软件。遗憾的是在线分析版本没有作图功能,需要下载结果文件后自行使用EXCEL等软件绘制柱状图。

20210705143929001060/resource/images/ba3a887fe31a48bea1307309f2156d14_14.jpg

图7. xCell: digitally portraying the tissue cellular heterogeneity landscape. Genome Biol. 2017 Nov 15;18(1):220.


进入分析页面后将网页下拉至底部,依次选择基因特征数据集,上传基因表达矩阵文件,点击运行按钮,分析结束后可下载分析结果文件:


20210705143929001060/resource/images/ba3a887fe31a48bea1307309f2156d14_16.jpg

图8. xCell运行示例


下载的文件包含xCell*pvals.txt,xCell*.txt和xCell*RAW.txt三个结果,通常使用xCell*.txt文件作为各类型细胞的得分结果,另外两个文件xCell官方解释为:Raw enrichment scores: *RAW.txt, P-values for the significance of the scores to be different from zero: *pvals.txt

五、
 
EPIC
 


http://epic.gfellerlab.org
EPIC [3] 为一款基于Constrained least square regression算法的分析软件,可以分析样本中6种免疫细胞丰度。相对于EcoTyper和xCell,该软件提供了较为丰富的结果图片。打开网页后,点击上传基因表达矩阵文件,其他参数可选择默认,随后点击运行计算。

20210705143929001060/resource/images/ba3a887fe31a48bea1307309f2156d14_18.jpg

图9. EPIC运行示例


运行完成后,可在线浏览各类型免疫细胞的丰度值,以及结果对应的柱状图,箱图和热图,也可将分析结果下载保存至本地。

20210705143929001060/resource/images/ba3a887fe31a48bea1307309f2156d14_20.jpg

图10. EPIC结果示例


六、
结语

即便测序技术在不断优化,单细胞转录组测序价格在持续下探,更有性价比的全转录组测序数据做的肿瘤免疫微环境分析仍有一战之力。如近期Wang B等人使用MCP-counter(该软件不支持在线分析)于J Immunother Cancer发表了IFN λ对于肿瘤微环境的影响 [4]
迈杰转化医学研究(苏州)有限公司依靠基因组学、蛋白组学、细胞组学及病理组学等综合性转化医学平台进行检测分析,拥有丰富的伴随诊断开发经验。其分子中心的polyA (protein-coding),Ribo-off (degraded, not suited for highly-degraded),RNA Exome (degraded & highly-degraded)三种RNAseq建库技术能应对不同质量类型RNA样本。迈杰生信平台提供了肿瘤免疫微环境,数据建模等多种数据分析支持。


20210705143929001060/resource/images/ba3a887fe31a48bea1307309f2156d14_22.jpg

图11.转录组生信分析概览


参考文献

[1]   Luca BA, Steen CB, Matusiak M, Azizi A, Varma S, Zhu C, Przybyl J, Espín-Pérez A, Diehn M, Alizadeh AA, van de Rijn M, Gentles AJ, Newman AM. Atlas of clinically distinct cell states and ecosystems across human solid tumors. Cell. 2021 Oct 14;184(21):5482-5496.e28. 

[2] Aran D, Hu Z, Butte AJ. xCell: digitally portraying the tissue cellular heterogeneity landscape. Genome Biol. 2017 Nov 15;18(1):220.

[3]   Racle J, de Jonge K, Baumgaertner P, Speiser DE, Gfeller D. Simultaneous enumeration of cancer and immune cell types from bulk tumor gene expression data. Elife. 2017 Nov 13;6:e26476. 

[4] Wang B, Zhou B, Chen J, Sun X, Yang W, Yang T, Yu H, Chen P, Chen K, Huang X, Fan X, He W, Huang J, Lin T. Type III interferon inhibits bladder cancer progression by reprogramming macrophage-mediated phagocytosis and orchestrating effective immune responses. J Immunother Cancer. 2024 Apr 8;12(4):e007808.




相关资讯