三维基因组中的结构变异

Abstract

染色体在结构和数量上的重排统称为结构变异(SV),它在很大程度上对人类的遗传多样性做出了贡献,因此其与癌症、罕见疾病和进化具有高度的相关性,近来的研究表明,SVs不仅仅可以影响基因剂量,还能影响基因的调控,SVs可以通过扰动TAD(topologically associating domains)来改变调控元件的拷贝数或对三维基因组造成影响,由于这些位置效应,SVs会影响距离SVs断点较远的基因的表达,从而导致疾病的发生,所以在解释这些疾病的病理的时候,必须要考虑SVs对三维基因组和基因表达调控的影响。

Read more »

棉属A基因组的起源与进化

Abstarct

在完成非洲棉 A1基因组、亚洲棉A2基因组、四倍体陆地棉(AD)1基因组组装后,表明A基因组可能起源于一个共同的A0基因组,同时在系统发生树上A1相比与A2更加接近于祖先A0基因组;同时异源四倍体的形成可能早于A1和A2基因组的分化。通过高斯密度分布函数估计表明,大约570万年前~61万年前出现的几次转座子爆发事件极大的促进了A基因组的扩张、物种的形成和进化。同时在基因区域大量的物种特异性的结构变异,改变了许多重要基因的表达,这些有可能是导致四倍体(AD)1中棉纤维品质得到改良。该研究不仅解决了长期以来颇具争议的概念:关于A基因组起源;同时为棉花的遗传改良提供了有价值的基因组资源。

Read more »

1.频数直方图

数据准备

1
2
3
4
5
6
7
8
> head(pacBioData)
V1 V2
1 Ghir_A01G000010 1
2 Ghir_A01G000030 1
3 Ghir_A01G000040 3
4 Ghir_A01G000070 3
5 Ghir_A01G000080 1
6 Ghir_A01G000100 2

如果你同时含有两个样本的频数信息,需要针对不同的样本画不同的的柱子;只需要在数据框中添加一个字段即可。例如我的数据中含有PacBio测序数据和参考基因组数据两个文件

  • PacBio
  • regerence
Read more »

  • 三维基因组之TAD的形成机制以及其特征

    Abstract

    了解细胞核内染色体折叠的机制对于确定基因组结构和功能之间的关系至关重要。最近应用的“染色体构象捕获”技术揭示了许多物种的基因组被组织成频繁交互的染色质区域,称为TADs。这种染色体区域化已成为高阶基因组结构和功能的重要特征。虽然TADs现在已经被广泛的研究于各种生物体中,但它们在大小、结构和形成过程中所涉及的蛋白质方面似乎有特定的特征。在此,我们描述了这些跨物种染色质区域的主要特征,并讨论了染色质结构、基因组活性和表观基因组之间的关系,着重讲述了TAD形成的机制原理。还涉及到了TADs在基因组进化中的潜在影响。

    Read more »

Blast+ 网页实现

 Stephen Altschul, PhD BLAST( Basic Local Alignment Search Tool ),基于局部比对算法的搜索工具,实现比较两段核酸序列或者蛋白序列之间的同源性的功能,快速找到序列之间的同源区域,并且进行打分来区分同源性的高低。BLAST的作者 斯蒂芬·弗兰克·阿尔丘尔 **Stephen Frank Altschul**,是一位著名数学家,同时本科期间对生物学有着浓厚的兴趣。因此他阅读了一些关于DNA的书籍其中包括詹姆斯.沃森撰写的《The Double Helix 》;同时选修了《进化生物学》;在博士期间为X射线晶体学项目写过计算机代码。1994年至今在美国国家生物信息中心NCBI从事计算生物学的工作。

​ 网页版BLAST相比与本地BLAST有着一些优势,比如不用下载软件只需要在现代一款浏览器上便可以实现。

Read more »

fasta文件校验

最近在利用javascripte构建网页blast时候,涉及到客户端文件和表单的提交。因此结合vue与element-ui框架封装了一个上传并对fasta文件进行校验的插件

Read more »

Circos安装

  1. 下载软件包

    http://circos.ca/software/download/circos/

  2. 解压

    tar -xvzf circos*.tgz

  3. 安装模块

1
2
3
4
5
6
7
8
9
10
#查看依赖项是否安装
cd circos*
./bin/circos -module
#####输出结果
ok 1.26 Carp
missing Clone
missing Config::General
ok 3.40 Cwd
ok 2.145 Data::Dumper
ok 2.52 Digest::MD5
Read more »

circos进阶之link图

背景

Links主要试图利用连线关系,表明染色体上不同位置之间的联系。这在实际生物学问题中很常用,尤其是在表示基因和基因之间的共线性的时候,link图是我们的不二选择,之前我们一起学习了使用MCScanX进行共线性分析,下游分析中可以画一个圈图,但是本人认为那个圈图无论是配色还是布局都不是特别好看,今天我们就来学习如何处理MCScanX的结果文件然后用circos去画出我们想要的圈图

Read more »

The Features and Regulation of Co-transcriptional Splicing in Arabidopsis

在多数真核生物钟,前体RNA的剪切对于基因表达是至关重要的。在之前哺乳动物、果蝇和酵母的研究中发现,大多数剪切事件与RNA的转录是同时进行的。然而在植物中,co-transcriptional splicing(CTS ) 在细胞中表现的特征和它具体的调控机制仍旧是不清楚的。因此作者使用chromatin-bound RNA sequencing技术来研究拟南芥中的CTS(剪切与转录共同进行)。通过分析发现,拟南芥中大量的可变剪切事件是受到 co-transcriptionally 决定的。同时CTS的效率与基因表达水平、染色质状态、还有基因中内含子、外显子数目存在相关性,而与基因的长度不相关。与此同时结合免疫共沉淀技术,表明一些hnRNP-like 蛋白(RNA结合蛋白),通过结合到外显子序列上来促进CTS。

Read more »

ExonSkipDB: functional annotation of exon skipping event in human

Abstract

在人类中,外显子跳跃事件是最常见的一种剪切事件,它通常会导致功能保守位点的缺失或者是ORF的偏移,最终导致多种疾病的产生。而迄今为止,基于癌症组织和正常组织来系统的、完整的注释人类中外显子事件,没有人做过。因此作者通过建立人类中外显子跳跃数据库,在外显子水平上,为研究多种癌症的治疗靶标提供功能注释和参考。作者从 TCGA 数据集和 GTEx 数据集中收集了33份癌症组织和31份正常组织数据,鉴定到了90616和89845个ES事件,对应于14272个基因。对于外显子跳跃事件,作者进行了多种功能注释,包括对ES事件产生的转录本的ORF预测,ES事件导致的蛋白功能丧失,ES事件与碱基突变、甲基化的关联。总的来说,ExonSkipDB数据库将会是用于研究癌症、药物发现的独特资源。

Read more »