关于Omisc Core WES 计算TMB的一点见解

TMB

上周FDA授予Nanthealth公司Omisc Core WES基因检测许可,这是FDA批准的首个使用全外显子测序方法来检测实体瘤的体外诊断产品。Omisc Core比先前FDA批准的MSK-IMPACT测序区域大了20倍。扩大目的是用来准确计算TMB,肿瘤体细胞突变还是在肿瘤相关的468个基因里找。’report somatic alterations in 468 genes and sequencing of 19,396 protein-coding genes to determine overall tumor mutation burden’。

现分析WES为啥比目前流行的大panel好。TMB定义是:每Mb区域里非同义突变的体细胞变异个数。下图是MSKCC发表的MSK-IMPACT跟WES对比得结果[1]。
3e166559252dd42a18c912cf0c3b5bb5c8eab84a.jpg

最理想的情况是MSK-IMPACT TMB与Exome TMB值一致,但事实有不可忽视的差异,例如我们选择TMB>10为高TMB值,那么有很大一部分如图1区域在WES判定为低TMB但在MSK-IMPCAT中判定为高TMB。从相关指数R2=0.76值来看,虽然相关性高,但仍然有很大的改进空间。两者不一致的根源在于统计抽样的大小。Exome TMB相当于检测了样本总体,MSK-IMPACT panel仅检测了一小部分样本,标准误差会随样本数增大而减小。按理说MSK-IMPACT测了2M碱基,已经很大了,例如统计中国人平均身高,抽样200万人已经足够。TMB的问题在于体细胞突变somatic是极小概率事件,每Mb碱基中平均约8个,如图3[1]。如果肿瘤样本的TMB值很高,两者的一致性高,这也符合统计原理。同时也可以知道Foundation Medicine文章图为什么比MSK好看一些[2]。

7ee1a444ad345982f9d2f7f603f431adcbef8432.jpg
40d08f13632762d0fe07b6dbafec08fa513dc651.jpg

Omisc Core方法是 tumor/normal成对样本WES测序,等于放大版的MSK-IMPCAT,实验方法及分析流程一样。Foundation Medicine不设正常组织作对照,他们并没有完全公开somatic的计算方法。笔者发现几篇文献公布的算法计算大panel单样本somatic结果跟设对照的很不一致。常见方法是用人群基因组数据库来过滤种系变异,但如果没有患者正常组织,这些突变将很难与罕见的遗传变异区分开[1],MSKCC说很难的事情应该也就是很难的。单样本计算somatic及TMB又很有吸引力,可以节省一半成本。笔者发现市场上有检测机构的报告是这样的。

f72b8f82b9014a90170f54d9a6773912b31bee5a.jpg

肿瘤特有突变也就是Somatic,其组织丰度怎么都在50%左右?而且是6个。这份报告很有可能报的是种系变异germline。那我们看看MSK的结果是怎么样的。图5统计了1万多个样本变异频率分布图,大于50%是小概率事件,一个样本中有6个50%基本上是不可能的。有人的做法是过滤掉40%以上的变异,而这又可能过滤掉非常重要的体细胞变异。


d891ceef76094b36fec50989accc7cd98d109d3f.jpg

Foundation Medicine 采用SGZ(somatic-germline-zygosity)算法来预测体细胞变异,该方法不需要患者匹配的正常对照,可广泛应用于临床研究。SGZ通过对突变的等位基因频率(AF)进行建模来预测每个突变的体细胞与种系状态,考虑到肿瘤含量,肿瘤倍性和局部拷贝数。预测的准确性取决于测序深度和拷贝数模型拟合[3]。这种仅仅靶向1.1 Mb编码区的SGZ算法能否用到40Mb的全外显子上还有待观察,甚至SGZ算法除了Foundation Medicine自己发表一篇文章外,目前也未见其他机构发表。

因此外显子测序用于肿瘤靶向测序计算TMB值,应该跟NantHealth一样设置正常组织作对照,检测全外显子区域somatic来计算TMB。

参考资料:
[1] Ahmet Zehir. Mutational Landscape of Metastatic Cancer Revealed from Prospective Clinical Sequencing of 10,000 Patients.Nat Med. 2017 Jun; 23(6): 703–713.
[2] Zachary R. Chalmers. Analysis of 100,000 humn cancer genomes reveals the landscape of tumor mutational burden.Genome Med. 2017; 9: 34.
[3] James X. Sun.A computational approach to distinguish somatic vs. germline origin of genomic alterations from deep sequencing of cancer specimens without a matched normal.PLoS Comput Biol. 2018 Feb
关于作者:刘远东:广州克拉斯基因科技有限公司创始人,算法研发工程师,有多年生信算法开发经验。开发了一系列肿瘤NGS检测算法,包括可以检测超高深度测序数据的UMI分子标签算法。广州克拉斯基因科技有限公司专注肿瘤云计算,简洁的界面化操作,无需在复杂的命令行下面计算;国内首家提供在线计算UMI测序数据的平台!

  • 发表于 2019-12-06 11:37
  • 阅读 ( 2665 )
  • 分类:测序技术

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
不写代码的码农
chendz

2 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章