4 Matching Annotations
  1. Nov 2020
    1. The FeatureTable[Frequency] QIIME 2 artifact is the equivalent of the QIIME 1 OTU or BIOM table, and the FeatureData[Sequence] QIIME 2 artifact is the equivalent of the QIIME 1 representative sequences file. Because the “OTUs” resulting from DADA2 and Deblur are created by grouping unique sequences, these are the equivalent of 100% OTUs from QIIME 1, and are generally referred to as sequence variants. In QIIME 2, these OTUs are higher resolution than the QIIME 1 default of 97% OTUs, and they’re higher quality since these quality control steps are better than those implemented in QIIME 1. This should therefore result in more accurate estimates of diversity and taxonomic composition of samples than was achieved with QIIME 1.

      SVs的优势

  2. Aug 2020
    1. CeRNA网络建设 对表达水平具有有意义关联的lncRNA,circRNA和mRNA进行了ceRNA分析。我们搜索了lncRNA,circRNA和mRNA序列之间的潜在miRNA反应元件(MRE),并且在lncRNA / circRNA和mRNA序列中相同miRNA种子序列结合位点之间的重叠被认为是对lncRNA / circRNA-miRNA-mRNA相互作用的预测。 。使用miRbase(http://www.mircode.org/)预测了miRNA结合位点,使用miRanda预测了miRNA–mRNA / miRNA–lncRNA / miRNA–circRNA的相互作用(Pasquinelli ,2012)。

      CeRNA

    1. 启动子区域被定义为基因TSS上游2,000 bp至下游1,000 bp的区域。对于蛋白质编码基因,从Ensembl BioMart 19中检索了TSS坐标。对于lncRNA,TSS被定义为最长同工型的第一个外显子的起始坐标。我们排除了反义和发散转录的lncRNA,以避免由lncRNA和蛋白质编码基因启动子重叠产生的偏倚。匹配长度(3,000 bp)的随机生成的非重复基因间区域用作阴性对照。我们从GTRD中检索了小鼠TF结合位点-公开可用的5,000多个统一处理的染色质免疫沉淀集,然后进行了432个小鼠TF的高通量测序(ChIP-seq)实验29。数据已汇总为与每个TF与小鼠基因组的非冗余结合位置相对应的元簇。我们使用工具床(v.2.25.0)与60相交,以确定TF结合位点与我们感兴趣的区域的重叠。基于与每个区域结合的不同TF的数量,计算转录调控和复杂性。作为一种补充指标,我们将每个TF的TF结合频率定义为每个基因类别的启动子与相应TF结合的分数。

      动态lnc结合TF

    2. 对于lncRNA的基因组分类,我们使用了工具FEELnc(v.1.0)62的基于滑动窗口的分类器模块,针对来自Ensembl的蛋白质编码基因对lncRNA注释进行分类(人类的v.75和所有人的v.77其他物种)。我们使用的最大窗口扩展为100,000个碱基对(bp),否则使用默认设置。根据默认标准对结果进行最佳匹配的筛选,优先选择最接近的基因和外显子,而不是内含子相互作用62。为了简化我们的分析,我们将分类折叠到位置(重叠,上游或下游)和链(有义或反义,扩展数据,图2a)。)。以上游反义方向转录并位于距离其指定编码基因最多2 kb的lncRNA被分类为发散的。最终,距离其最近的编码基因超过100 kb的lncRNA被分类为“分离的基因间”。

      FEELlnc的分类,为什么有窗口