TSCD是Tissue-Specific CircRNA Database的简写,通过软件预测人和小鼠不同组织中的环状RNA,然后去寻找组织特异性的环状RNA。该数据库网址如下
http://gb.whu.edu.cn/TSCD/
从ENCODE和GEO这两个公共数据库中收集人和小鼠不同组织的转录组测序数据,然后利用以下3款软件识别其中的环状RNA
find_circ
CIRI
circRNA_finder
选取三款软件的并集作为最终的结果,为例降低假阳性率,只保留junction reads个数大于2的环状RNA。采用上述策略检测到所有组织中的环状RNA之后,接下来就可以识别组织特异性的环状RNA。
该数据库中,将只在某一个组织中表达的环状RNA定义为组织特异性的环状RNA, 简称TS circRNA,示意如下
识别到TS circRNA之后,后续还进行了以下3种分析
筛选表达量高的TS circRNA, 对其来源基因进行GO富集分析
预测miRNA结合位点,从环状RNA头尾各取50bp序列,用targetscan来预测这100bp序列上的miRNA结合位点
预测蛋白结合位点,从starbase数据库下载CLIP-Seq的数据,同样分析头尾个50bp区域上的蛋白结合位点
将以上所有的结果整合起来,就构建成了TSCD数据库,整个数据库构建的流程示意如下
官网提供了不同基因组版本供我们查阅,示意如下
点击Gene Symbol,可以查看该环状RNA在不同组织中的表达量,示意如下
点击MRE可以查看环状RNA可以结合的miRNA,示意如下
点击RBP可以查看环状RNA可以结合的蛋白,示意如下
该数据库不仅提供了一个环状RNA的集合,还提供了MRE,RBP等对应的功能注释信息。
·end·