三维基因组中的结构变异

三维基因组中的结构变异

Abstract

染色体在结构和数量上的重排统称为结构变异(SV),它在很大程度上对人类的遗传多样性做出了贡献,因此其与癌症、罕见疾病和进化具有高度的相关性,近来的研究表明,SVs不仅仅可以影响基因剂量,还能影响基因的调控,SVs可以通过扰动TAD(topologically associating domains)来改变调控元件的拷贝数或对三维基因组造成影响,由于这些位置效应,SVs会影响距离SVs断点较远的基因的表达,从而导致疾病的发生,所以在解释这些疾病的病理的时候,必须要考虑SVs对三维基因组和基因表达调控的影响。

知识补充(在之后的文章中遇到不会的生物关键词,可以来这里查询)

  • 结构变异(SV)包括以下五种类型:deletions(缺失), duplications(加倍), inversions(倒位), insertions(插入) and translocations (易位)
  • 位置效性是指SVs可以不影响编码序列或启动子区域而导致疾病的发生
  • Copy number variation (CNV):一种遗传变异只包括数量上的染色体重排,如缺失、加倍
  • Penetrance(外显率):一种对有特定遗传变异(如某一特定基因的突变)的人表现出遗传障碍的症状和体征的比例的测量。如果有一些个体存在这种突变没有表现出这种疾病,这种情况称为 incomplete penetrance(不完全外显)
  • Haploinsufficiency(单倍剂量不足):基因的一个拷贝被灭活或缺失,剩下的拷贝基因的表达不足以保持正常功能的一种状态。
  • Gene dosage (基因的剂量):一个基因的拷贝数,包括在基因组中这个基因的所有的调控区域。
  • Intra- TAD SVs :出现在TAD内部的结构变异
  • Inter- TAD SVs :出现在TADs间的结构变异
  • TAD shuffling :基因组内TADs的重排列
  • Enhancer adoption :其中一个基因的异常表达是由位于不同调节区域的另一个基因的增强子所驱动的这种现象,又称作Enhancer hijacking(增强子劫持)

Structural Variation In Disease

用于鉴定SVs的生物学方法有很多,但都各有利弊

  • array comparative genomic hybridization (array CGH) 被广泛用于鉴定CNV,但它的分辨率较低而且无法鉴定 balanced rearrangements
  • Whole- genome sequencing (WGS)可以鉴定所有类型的SVs,但它不能在重复的区域(出现多个断点)鉴定断点
  • Long- read sequencing technology可以很好的鉴定SVs和断点,但由于价格问题不能用于日常的临床诊断

De Novo Structural Variation

  • 在人类基因组有多少SVs和疾病有关是一个重要的问题,因为新发生的SVs通常和疾病的发生有关,所以要想将基因组的多态性和导致疾病的SVs区分开,就需要去鉴定SVs是新发生的还是遗传于上一代的。
  • 由目前的研究来看,即使使用相同的数据,估计出的新发生SVs的比率和其对疾病的影响也有很大不同。
  • 虽然新生的SVs更容易引起疾病,但很多因素均会使得外显率降低,可能是由于潜在的隐形或者双等位基因遗传

Gene Dosage

  • SVs影响编码序列是用根据它对基因的剂量的影响来解释的,这个方法在研究孟德尔疾病的病理时取得了巨大的成功,这个方法主要是用array CGH数据和动物的数据去鉴定疾病基因
  • 由于大多数SVs也影响非编码区域,所以还需要考虑基因的调控机制

From Linear View To 3D Perspective

  • 人的基因组种存在大量的调控序列,大多数的SVs会影响调控因子的位置和数量,在三维基因组种这些可能会影响空间结构,所以说了解基因组的空间结构对理解SVs的潜在致病性十分重要,(如果想详细了解基因组的空间结构,请阅读此文章的Introduce部分)
  • SVs通常会改变Hi-C的数据结果,还会留下一些信号供我们进一步理解,如缺失通常会使得原来被分离的两个区域发生新的交互。
3D FIG1

The 3D Regulatory Landscape

  • 染色质的折叠不仅束缚了染色质还为以增强子驱使的长距离的基因调控提供了条件,长距离的基因表达调控通常包含两种不同的顺式作用元件:启动子(由核心启动子和附近的调控元件组成);更多的远端调控单位(包括所谓的增强子或被称作基因座控制区),TAD同时限制了增强子作用的基因组区域
  • 60–70%的TAD在不同的细胞类型和五种类型之间都是保守的,这说明了TAD在基因组形式十分基础的功能
  • TAD的鉴定十分依赖于计算机的算法,但其受限于分辨率和阈值的调整

Enhancer Redundancy

  • 研究表明,发育基因通常由具有组织特异性活性的多种增强子元件控制
  • 增强子的活性部分或者完全重叠,这种现象被称作增强子冗余或者‘shadow enhancers’。冗余的增强子具有很强的转录活性控制一些关键的基因,而且其与癌症也有关联
  • 增强子并不是单个独立的元件,而是形成一个复杂冗余的调控单位,为基因的表达提供了稳定精确的调控
  • 总的来说,基因是由和自身具有亲和力和功能关系的调控元件所调控的,这些特性限制于他们在一维基因组的具体排列以及染色质的三维结构

The Impact Of SVs On Gene Regulation

  • 缺失和加倍除了会影响基因的剂量,它也有可能影响顺式调控元件的剂量和位置和这个位点的染色质的高级结构
  • 同样,倒位和易位不仅会影响编码序列和转录,也会对三维结构造成影响
  • 一些临床上的SVs影响基因组三维结构的例子如下

FIG2

Intra- TAD SVs: Effects On Enhancer Dosage

  • SVs可以通过影响顺式调控元件进而对距离几百kilobases的基因造成影响
  • TAD内部的SVs可能会影响增强子的剂量进而会导致内源目的基因的功能缺失或获得
  • 当TAD内部调控元件缺失时,可能会导致基因功能的丧失,但由于增强子的冗余,所以单个的丢失往往不会造成影响
  • TAD内部调控元件的加倍可能导致内源靶基因的组织特异性过表达或错表达从而导致疾病
  • 目前研究表明,不影响编码序列和TAD边界的倒位对长距离的基因调控没有影响
FIG3
  • a图:基因A、B分别控制头和四肢的发育,他们分别有各自的位于不同TAD的组织特异性顺式调控元件,TAD之间存在边界
  • b图:TAD内部的倒位(不影响编码基因或TAD的边界)对基因的远距离的调控没有大的影响,尽管目前尚无病例报道。
  • c图:调控B基因的增强子的缺失会导致B基因功能的丧失
  • d图:调控B基因的增强子的加倍会导致B基因的错误表达或过量表达

Inter- TAD SVs: Effects On 3D Architecture

发生在TAD间的SVs同样会影响三维结构,并且具相关研究表明染色质域的改变是发育障碍和癌症的重要疾病机理,TAD间的SVs可能会导致以下三种TAD的变化

  • TAD fusion
  • Neo-TADs
  • TAD shuffling

下面是两幅图解

FIG4
  • a图:基因A、B分别控制头和四肢的发育,他们分别有各自的位于不同TAD的组织特异性顺式调控元件,TAD之间存在边界
  • b图:边界上的元件缺失导致TAD的融合和增强子劫持,B基因的增强子会影响基因A的表达,同时也会导致四肢的发育异常
  • c图:边界和A基因的复制会导致neo- TAD的形成,在新的TAD种,加倍的调控B基因的增强子会调控A基因的表达,从而导致四肢发育异常
  • d图:A基因不加倍,即使形成新的TAD,也不会导致转录的变化
FIG5
  • a图:基因A、B分别控制头和四肢的发育,他们分别有各自的位于不同TAD的组织特异性顺式调控元件,TAD之间存在边界
  • b图:TAD间的倒位,会导致来自B基因的增强子劫持,会导致A基因在四肢中的异常表达,同时也会导致B基因功能的丧失
  • c图:平衡易位通过将控制肢体发育的B基因的增强子替换为控制脊髓发育D基因的增强子来使基因组的TAD结构域重新排列,导致B基因的不表达,进而使得脊髓发育异常(D基因的变化图中没有展示)

Interpretation Of SVs In The 3D Genome

考虑到SVs的多重影响,作者提出了一个系统的方法来解释SVs

FIG6
  • 第一步,判断基因SVs是调控元件突变还是基因的编码区突变
  • 第二步,判断突变是否引起TAD边界的改变,进而对其进行分类
  • 第三步,鉴定顺式调控元件和潜在的目的基因
  • 第四步:功能验证

Conclusions And Future Developments

作者提出了现存的五个挑战

  • SVs的比率计算和断点的精确定位还存在问题
  • 相关的数据相对分散,需要一个跨学科的团队去研究人体的SVs
  • 对于非编码区的调控序列的相关研究还十分有限,使预测表型变得十分困难
  • 目前计算机预测工具还不够,需要深入包括动物模型在内的功能研究,来确定变异的致病性
  • 目前,SVs主要是使用基因的剂量效应来解释,对于非编码区域的位置效应认识较浅,导致许多患者无法做出诊断
------ 本文结束 thankyou 感谢阅读 ------

欢迎扫一扫上面的微信二维码,订阅 codeHub 公众号