Cell Reports Methods:深圳湾实验室孙坤课题组揭示cfDNA片段化组学分析中的系统偏差

2024-06-14 测序中国 测序中国 发表于上海

该研究揭示了以参考基因组为基础的传统cfDNA分析流程中人种差异等因素所导致的系统偏差,并开发了一款无需参考基因组、快速、准确的cfDNA片段化组学分析算法Freefly。

近日,深圳湾实验室孙坤课题组在Cell Reports Methods期刊发表题为《Systematic biases in reference-based plasma cell-free DNA fragmentomic profiling》的文章。该研究揭示了以参考基因组为基础的传统cfDNA分析流程中人种差异等因素所导致的系统偏差,并开发了一款无需参考基因组、快速、准确的cfDNA片段化组学分析算法Freefly

图片

研究发现

01 cfDNA传统处理方法存在系统误差

外周血循环游离DNA(circulating cell-free DNA,简称cfDNA)是一种细胞死亡后自然降解产生的DNA片段。cfDNA在癌症早期诊断、肿瘤起源追溯与分型、组织损伤监测等方向具有重要的意义。研究表明,肿瘤来源的cfDNA分子与背景cfDNA(主要来源于造血系统)存在显著的差异,例如片段大小、末端序列,是获得广泛验证的癌症检测标志物。在传统的分析流程中,为了获取cfDNA的片段大小和末端序列,需要将cfDNA测序数据比对到参考基因组上。该过程存在两个问题:一是参考基因组难以完美适配所有人种的基因序列,因此导致遗传背景依赖的偏差;二是所需要的时间较长,在一定程度上限制了cfDNA片段化组学在临床诊断中的实时应用。下图展示了在中国人群中,使用GRCh38(目前最常用的参考基因组)和Han1(来自中国南方人种)参考基因组得到的结果之间存在系统性偏差。

图片

02 Freefly算法

为此,孙坤课题组开发了一款高速无偏cfDNA片段组学分析软件,命名为Freefly。该软件可以在不使用参考基因组的情况下,获得cfDNA片段化组学结果,从而避免了参考基因组带来的偏差,为cfDNA数据分析提供了更好的处理方案,并且在癌症早期诊断等多方面展现了其强大的潜力。

图片

为测试Freefly算法性能表现,该研究使用多组数据来比较传统方法和Freefly性能表现。结果显示,处理50M读数,传统方法获取cfDNA特征值大约需要2小时,而Freefly仅需要2分钟左右即可完成,速度提升了约60倍(如下图所示)。与此同时,Freefly所获得的特征值(Size、CCCA End Motif、以及Motif多样性)与传统方法高度一致,甚至可以提供更好的诊断性能,表明了Freefly在癌症诊断中的价值。

图片

研究支持

本论文所有作者均为深圳湾实验室肿瘤所孙坤课题组成员,其中孙坤博士为本论文的通讯作者,研究助理刘晓懿、联培博士生杨梦琦为本文的共同第一作者。该研究获得国家重点研发计划、广东省基础与应用基础研究基金项目、国家自然科学基金、深圳湾实验室重大项目、深圳湾实验室计算中心平台等支持。

原文链接

https://www.cell.com/cell-reports-methods/fulltext/S2667-2375(24)00149-8

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2209946, encodeId=39372209946c9, content=<a href='/topic/show?id=fb8a4526a3' target=_blank style='color:#2F92EE;'>#cfDNA#</a> <a href='/topic/show?id=7ba711552e4c' target=_blank style='color:#2F92EE;'>#系统偏差#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=68, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=4526, encryptionId=fb8a4526a3, topicName=cfDNA), TopicDto(id=115527, encryptionId=7ba711552e4c, topicName=系统偏差)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cade5395722, createdName=梅斯管理员, createdTime=Fri Jun 14 18:16:11 CST 2024, time=2024-06-14, status=1, ipAttribution=上海)]
    2024-06-14 梅斯管理员 来自上海

相关资讯

Genome Med:cfDNA多模态测序技术MESA可同时检测4种表观遗传模式,改善结直肠癌检测

研究显示,MESA能够同时推断4种表观遗传模式:cfDNA甲基化、核小体占有率、核小体模糊性以及跨基因启动子和多聚腺苷酸化位点的WPS。

IVD前沿丨cfDNA数据检测于临床新应用

作者开发了一种方法,利用单细胞转录组图谱从头扫描cfDNA片段图谱,以获得健康和疾病中一系列潜在的细胞类型贡献者。

准确性可达83%!NEJM:“滴血验癌”或为结直肠癌筛查新策略

近日,《新英格兰医学杂志》(NEJM)发表一项研究,表明使用血浆游离DNA(cfDNA)检测用于筛查结直肠癌灵敏度可达83%,晚期肿瘤特异度为90%,晚期肿瘤癌前病变灵敏度为13%。

重磅Science:液体活检的挑战与未来展望

文章中作者分享了液体活检的背景、挑战、局限性及可能解决方案,详细介绍了对麻省理工最新成果的看法,最后对液体活检的未来进行了展望。

Cell子刊:鲁志/王鹏远/卢倩团队合作发表消化道癌症cfDNA+cfRNA多组学研究新成果

通过最新的、高灵敏的微量核酸测序技术,第一次在消化道癌症病人的血浆中系统全面地分析和对比了cfDNA+cfRNA的4种组学和10余种变异类型,发现多组学相对于单组学的检测效果有了较好的提升。

Nat Commun:机器学习分类器CUPiD:基于cfDNA甲基化模式预测原发灶不明癌症的起源组织

文章介绍了一个高度准确的机器学习分类器CUPiD,可基于cfDNA甲基化模式准确预测29种肿瘤类型的TOO。

肺癌脑转移患者放疗期间cfDNA基因突变检出率如何?脑脊液vs血浆

本研究探索了NSCLC-BM患者RT期间CSF cfDNA的动态变化和外周血T细胞亚群的频率。

Cell Reports Medicine:多模态cfDNA基因组和片段组学模式可增强癌症生存率和复发分析

基于全基因组测序,研究团队开发了片段末端综合分析(FrEIA)评分,可使用低覆盖率全基因组测序(WGS)定量评估液体活检样本。

Clin Chem:基于脑脊液cfDNA的纳米孔测序可对脑肿瘤患者进行初步诊断及分类

研究团队对来自脑肿瘤患者脑脊液(CSF)中的游离DNA(cfDNA)进行了纳米孔测序,并使用随机森林分类器分析了拷贝数变异(CNV)和整体DNA甲基化模式。

Nat Commun:FinaleMe模型:基于血浆cfDNA片段化模式预测DNA甲基化水平和起源组织状态

研究团队开发了一种名为FinaleMe的计算方法,可预测每个cfDNA片段中每个CpG的DNA甲基化状态,并获得CpG位点的连续DNA甲基化水平;进一步从推断的甲基化模式中预测相关的起源组织状态。