一、 microRNA(small RNA)测序概述
上海伯豪生物技术有限公司应用Illumina第二代高通量测序技术对microRNA及Small RNA文库进行测序,可以一次获得数百万条microRNA序列,能够快速鉴定出不同物种、不同组织、不同发育阶段、不同疾病状态下已知和未知的microRNA及其表达差异。同时,新一代测序技术在microRNA互补链、microRNA编辑、microRNA异构体检测、新microRNA预测及microRNA靶基因分析方面也具有重要应用意义,为研究microRNA对细胞进程的作用及其生物学影响提供了有力工具。上海伯豪生物技术有限公司应用Illumina第二代高通量测序技术对microRNA及Small RNA文库进行测序,可以一次获得数百万条microRNA序列,能够快速鉴定出不同物种、不同组织、不同发育阶段、不同疾病状态下已知和未知的microRNA及其表达差异。同时,新一代测序技术在microRNA互补链、microRNA编辑、microRNA异构体检测、新microRNA预测及microRNA靶基因分析方面也具有重要应用意义,为研究microRNA对细胞进程的作用及其生物学影响提供了有力工具。
二、 miRNA测序技术特点
1.高灵敏度:理论上可以检测单个细胞中一个拷贝的microRNA;
2.高精度:可以检测microRNA单个碱基的差异;
3.不受先验信息的干扰,既能鉴定已知microRNA,又有能力发现新的microRNA;
4.保留定向信息,用于链特异的表达分析;
5.利用Barcode在单次运行中经济地分析多个样品。
三、上海伯豪microRNA(Small RNA)测序服务内容
对客户提供的total RNA或microRNA样品进行定量检测,检测合格后进行microRNA文库构建、簇生成及上机测序。上海伯豪生物microRNA sequencing服务,为您提供从样本抽提到数据分析的全面综合服务,服务内容包括:样品抽提质检, 文库建立,测序,生物信息学分析以及数据报告。
数据分析流程
1. MicroRNA长度分布统计以验证试验可靠性
应用fastx(fastx_toolkit-0.0.13.2)对测序原始reads进行预处理,去除接头序列以及低质量序列(包括模糊碱基N,碱基质量小于10以及长度小于18nt的序列),最终给出处理结果统计表以及长度分布图。
2. MicroRNA比对注释统计
将测序得到的序列与Sanger miRBase数据库,已知rRNA、tRNA、重复区、RefSeq数据库,以及其它非编码数据库如ncRNA,piRNA,Rfam数据库比对,对已知microRNA进行注释。
下表为经过注释的结果,其中分别列出和miRBase数据库,pirna数据库,Rfam数据库以及ncRNA数据库的比对情况。
下图为针对miRBase种Sus scrofa物种进行的比对注释统计:
由之前所得的注释结果,可以作图来更进一步展示其结果:
对整体的注释结果,还可以采取进一步的分析,例如:
(1) 统计碱基偏好性,下图就是测序所得序列分别在21,22,23,24长度上的5’碱基分布情况。
(2)对于测序所得序列,可以统计出其正负链分布情况,以找寻生物学上的特征。
针对某单一microRNA,也可以对其进行更深度的分析。
例如,对其序列的匹配情况进行分别统计:
还可以对其对应的microRNA前体二级结构进行观察。
3. 其它Small RNA的分类注释
将测序得到的序列与物种所对应的基因组数据库比对,对有注释的reads的来源进行分类统计,鉴定并统计出已知的microRNA及其它各种不同种类的small RNA分子。
如下图,经过与数据库进行分别比对,可以鉴定并统计出包括tRNA、rRNA、snoRNA、snRNA的数量及分布。
4. 新microRNA预测
MicroRNA前体的标志性发卡(hairpin)结构能够用来预测新的microRNA。对于测序结果中未比对注释上的序列,我们将其与该物种的全基因组序列进行比对分析,通过折叠模型分析,若有序列位于茎环结构上,则初步判定该序列为一个候选的新microRNA。
对于预测出的新microRNA,会统计并列出其所位于的染色体,起始位置,终止位置,正负链,以及数目,长度,GC含量,最小自由能等数值。
对于新microRNA,我们还会计算并绘制出其前体的二级结构,以及其与成熟microRNA之间的位置关系。
5. 饱和度分析图表
饱和度分析:随着测序量的增加,检测到的miRBase上的microRNA是否随之上升。我们会将注释结果按比例划分作图,以观察样品测序结果注释的趋势,发现其在生物学上的合理性。
6. 样本间microRNA表达差异的筛选
采用DEGseq R语言包结合perl脚本将样品按照客户的分组情况(如:对照组与实验组),进行microRNA表达量的比较分析。在差异分析中,采用TPM(Transcripts per million,公式为:单一microRNA reads数×106/总reads数)作为标准化数据。
结果展示如下:
差异microRNA表达模式聚类分析
可以对组间差异表达的
7. 靶基因预测
采用miranda软件,对microRNA序列以及对应物种的基因组cDNA序列进行可能的靶位点预测。
Miranda软件比对结果示意图如下:
或采用TargetScan数据库关联microRNA的靶基因,结果形式包含microRNA和靶基因的相关信息。
8. GO功能显著性富集分析(靶基因)
9. Pathway显著性富集分析(靶基因)
伯豪案例
应用案例一:雌雄同株异花的毛白杨microRNA的性能分析以及对靶基因表达的影响
本研究报道了与花发育相关的miRNAs以及它们的靶基因,根据基因注释,将所有的靶基因分为四类。第一类,花发育相关:Pto-F6, Pto-F11, Pto-F14, Pto-F19, Pto-25, Pto-36, Pto-F51, Pto-F54以及Pto-F66。第二类,Ca2+转运相关:Pto-F28 和 Pto-F45(雌花特异性miRNA),Pto-F16(雄花特异性miRNA)。第三类,激素调节相关:10个miRNAs(除Pto-F6以外均为雌花特异性)。第四类,与DNA甲基化相关:3个miRNAs。
原文出处: Sexual dimorphism floral microRNA profiling and target gene expression in andromonoecious poplar (Populus tomentosa). PLoS One. 2013, 8(5):e62681.(IF3.730)
应用案例二:MeCP2调控DGCR8/Drosha复合物抑制miRNA加工和树突发育。
MeCP2是一种甲基化DNA结合蛋白,负责招募转录抑制复合物并且关闭基因表达,重要转录调控因子。
人类MeCP2基因的突变或者拷贝数增多均会导致孤独症(Autism)等发育性神经系统疾病。中科院上海生科院神经科学研究所仇子龙研究组利用高通量测序技术对MeCP2基因敲除小鼠海马区的成熟小RNA进行定量分析,发现 MeCP2抑制了大量小RNA的产生。该研究揭示了孤独症相关蛋白MeCP2参与小RNA剪切加工的新功能,并提示此功能很是MeCP2基因突变导致发育性神经系统疾病的相关致病机理。
原文出处:MeCP2 Suppresses Nuclear MicroRNA Processing and Dendritic Growth by Regulating the DGCR8/Drosha Complex p547. Developmental Cell.2014,28, 547–60.(IF:10.366)
miRNA测序服务应用案例