登录  注册 退出

密码子图书馆

您现在的位置是: 首页 > 实验技能 > RNA实验操作

RNA实验操作

文献分享 | RNA时间戳:敢问RNA芳龄几何?

密码子图书馆 2021-09-13 13:06:53RNA实验操作
“正因为你为你的玫瑰花费了时间,才使你的玫瑰变得如此重要。”——《小王子》人们常用“时间”这一标尺来衡量价值。对于个体生命而言,时间是有限而珍贵的。我们用“年龄”来度量生命存续的时间,作为追溯生命诞生的标记,也作为生命如影随形的“标签”。在微观的分子

“正因为你为你的玫瑰花费了时间,才使你的玫瑰变得如此重要。”

——《小王子》


人们常用“时间”这一标尺来衡量价值


对于个体生命而言,时间是有限而珍贵的。我们用“年龄”来度量生命存续的时间,作为追溯生命诞生的标记,也作为生命如影随形的“标签”。在微观的分子生命世界中,时间同样有限和珍贵,“年龄”同样是重要的标签。DNA、RNA和蛋白等分子诞生和存续的时间,往往与特定生物学过程密切关联。


本期分享的这篇文章,来自Broad Institute的Fei Chen团队和MIT的Edward S. Boyden团队合作,2020年10月19日在线发表于期刊《Nature Biotechnology》。研究人员正是出于对探知单个RNA分子“年龄”的好奇,开发了一种叫做“RNA时间戳(RNA timestamps)”的技术,通过借助RNA编辑系统来推断RNA-seq中单个RNA分子的年龄,即推断被时间戳标记的目标RNA是何时被转录产生的。

 

图片


基于当前的技术手段,对RNA年龄进行推断,还是极具挑战性的。因而,作者首先将问题做了简化,把初步的目标定位在:可估计单个启动子产生的每条RNA的年龄。实现初步目标后,则尝试探索将相应策略应用到单个细胞的总RNA转录本,以期向构建单细胞转录历史全景图的长远目标迈进。


探知RNA的年龄,从本质来看,是一个时间计量问题。解决这一问题,计时器显然是个不错的选择。在这篇文章中,研究者开发的RNA时间戳,借助RNA编辑系统来编码时间信息,原理上,也可看作是一款在时间计量算法上较为独特的“计时器”。所谓RNA时间戳,是研究人员设计的特定的报告基序(reporter motif),可标记在mRNA的3’UTR区域。如图1所示,基序中包含多个MS2结合位点,用于招募特异性靶向这些位点的MS2衣壳蛋白MCP,MCP融合了腺甙脱氨酶ADAR2,可将ADAR2带至RNA时间戳位点,进而引发时间戳序列上A-to-I编辑事件发生。被编辑的位点数量随着时间的推移不断累加,在后续RNA-seq分析中,编辑位点可被识别为A-to-G突变位点并计数,作为推断RNA年龄的基本依据。可见,该系统主要利用了ADAR2的连续酶活性,基于编辑位点的计数,实现对RNA年龄精确到“小时”的量化推断。

 

图片

图1 RNA时间戳借助RNA编辑系统捕获时间信息

 

在前期工作中,研究者对不同的RNA时间戳序列和ADAR变体做了筛选,保留了一对具备时序编辑规律的组合,即在小时级的单位时间上,编辑位点数具有更高的时序分辨率。


鉴于准确性的考虑,作者首先对初步构建的体系做了校准和评估。研究者对构建好预期体系的细胞,添加转录抑制剂之后,在不同的计时时间点(整数小时)裂解细胞,从而实现捕获不同时间点的时间戳序列信息。基于已知的RNA年龄信息和相应的编辑位点观测,对体系进行评估和建模。与预期一致,随着时间的增长,编辑位点数也是逐步增长,呈现较好的线性正相关性(图1)。更为关键的是,对于任一给定时间的时间戳,其平均编辑位点数在不同的生物学重复中是可高度复现的。因而,对于随时间增长的编辑位点数,作者能够通过泊松二项式模型精确建模,基于经验分布实现对单个RNA分子年龄的预测(95%置信区间 2.7±0.4h)。作者将这些在单小时时间点实验中获得的单RNA编辑位点分布称为“单时编辑分布(single-hour editing distributions)”。


进一步地,考虑到细胞中的RNA转录本通常是多拷贝的,研究者尝试通过分析单一启动子产生的带有时间戳标记的RNA总体,来探知该启动子的潜在转录动力学。他们开发了一套算法,能够预测与一些特定时间戳具有一致性的转录程序(transcriptional program)。此处转录程序特指功能函数,描述了时间戳数量作为时间的函数。研究者采用一种离散、归一化的形式来表示转录程序,即一个含有12个加和为1的正值的集合,每一个值表示单小时窗口中产生的RNA的比例。算法基于梯度下降识别单时编辑分布的凸组合,最小化观测编辑的分布与凸组合相关编辑分布间的L2范数。最终得到描述最优凸组合的权重,即作为对转录程序的推断(图2)。


作者将这一算法应用于单时间点时间戳标记RNA数据集中的随机抽样样本,发现该算法不仅能够推断这些数据来自同一时间点,还能够预测出相应的确切时间点。其中的准确度随着数据集中RNA数量的增多而单调递增。经测试,对大于50个RNA的数据集,算法产生的权重分布已经可以与产生这些数据集的单时转录程序高度吻合(图2)。

 

图片

图2 时间戳标记RNA可用于时间维度的转录程序预测

 

然后,为了更加贴近现实应用,研究者测试了该算法在更为复杂的混合样本(含不同时间点的时间戳标记RNA数据集)中的有效性和准确性。他们计算生成模拟测试数据集,是包含了1小时和5小时样本各一半的混合数据。采用上述梯度下降算法,针对不同数量的抽样来推测产生这一抽样数据的转录程序(图3)。即使仅使用10条RNA,该算法也能在51.3% ± 7.6%的情况下预测得到具有两个峰值的转录程序。在应用了200条测试数据的时候,该比例可以上升到86% ± 13%。为了在实验数据中验证这一表现,实验人员设计了两组启动子特异的条形码(barcode)标记RNA,分别由强力霉素敏感的启动子和光敏感的转录因子驱动。在不同的时间点,使用不同的刺激,可得到两组“年龄不同”的RNA转录本。结合RNA时间戳标记和条形码特异识别,可建立两种时间戳编辑的分布,分别对应于由强力霉素诱导和光刺激产生的转录事件。在算法预测的转录程序结果中,表现为两个明显的峰(图3)。随后,研究者对两个时间点所有数据集进行二次抽样,对算法进行更高难度的测试。与模拟数据相比,这里的抽样是难以实现两个时间点的均一抽样的。所以这里的测评相对来说,条件更为苛刻。但结果仍然比较乐观,该算法在实际实验数据中的表现,与在模拟数据中的表现较为相似。对于仅含10条RNA的数据集,能够在44.5% ± 0.7%的情况下得到两个峰。对于含有200条RNA的数据集,这一比例高达90.5% ± 0.7%。


图片

图3  RNA时间戳识别不同时间点的转录事件

 

最后,研究者探索了将RNA时间戳系统应用到实际研究工作中的可行性和有效性,包括应用到检测细胞中特定转录事件的发生,以及整合到基于液滴条形码技术的单细胞高通量测序技术中。研究者开发了特定的分子生物学工作流程,对时间戳进行针对性扩增,实现了时间戳和条形码都能够在单细胞双端测序中被读出(图4)。


图片

图4 将RNA时间戳系统整合到单细胞测序流程

 

总结


该文章创新性地利用ADAR2的连续酶活性,设计了RNA时间戳序列,基于编辑位点的时序计数,建模并开发了具备较高准确率的RNA年龄推导算法。虽然距离实践应用还有较远的距离,但这一创新性的探索,为我们研究时间维度上的转录组提供了更多的新思路和新启发。
文章来源:微信公众号生物信息与表观组学