登录  注册 退出

密码子图书馆

生信讲堂

  • 微生物组大数据挖掘神器QIIME 2

    微生物组大数据挖掘神器QIIME 2

    QIIME是微生物组领域使用最为广泛的分析流程,自2010年发表于Nature Methods之后引用次数已突破21000次。不同于QIIME,QIIME 2是基于Python 3与插件架构重新开发,为满足大数据量、可重复分析的要求而诞生的...

    qiime2 扩增子 生信软件
  • Pyfastx:一个快速随机读取基因组数据的Python模块

    Pyfastx:一个快速随机读取基因组数据的Python模块

    今天介绍一个 Python 模块:pyfastx,用于快速随机访问基因组序列文件。Pyfastx: a robust python module for fast random access to sequences from plain ...

    python fastq fasta
  • eggnog-mapper功能注释教程

    eggnog-mapper功能注释教程

    eggNOG-Mapper介绍通常功能注释的思路都是基于序列相似性找直系同源基因,常见的方法就是BLAST+BLAST2GO, 或者是InterProScan。eggNOG-mapper的作者认为这种方法不够可靠,毕竟你有可能找到的的是旁系...

    数据库 功能注释
  • Pfam在线注释以及本地化全攻略

    Pfam在线注释以及本地化全攻略

    Pfam(http://pfam.xfam.org/)是一个被广泛使用的蛋白家族结构域数据库,其依赖于多序列比对和隐马尔可夫模型(HMMs)鉴定一个或多个蛋白质功能结构域。结构域的不同组合方式产生的蛋白质在自然界中各种不同。因此蛋白结构域的...

    数据库
  • 常用比对软件集合

    常用比对软件集合

    Bwa适用范围:二代测序数据快速比对到genome上。bwa作为序列比对界的模式软件,短小精悍,适用于多种场合,很有必要搞懂他内部的比对算法,最好也搞懂它是如何实现的。建立索引:bwa index in.fasta索引建立好之后会生成五个文...

    生信软件
  • 批量下载fasta文件和gbk文件

    批量下载fasta文件和gbk文件

    GenBank数据库是在科研工作中经常用到的数据库之一,它由美国国家生物技术信息中心(the National Center for Biotechnology Information,NCBI)建立和维护。该数据库包含了所有已知的核酸序列...

    python Biopython 脚本分享
  • NCBI|叶绿体基因组数据上传

    NCBI|叶绿体基因组数据上传

    叶绿体基因组NCBI上传小编最近在NCBI上传了好几次数据...想着可以把具体的上传步骤写下来,供大家参考。以下是叶绿体基因组的上传示例,大家可以瞅瞅 准备工作1. 登录NCBI官网:https://www.ncbi.nlm.nih.go...

    NCBI 数据上传
  • NCBI|宏基因组原始数据上传

    NCBI|宏基因组原始数据上传

    第一步申请Biosample编号1.首先我们需要进入NCBI网页https://www.ncbi.nlm.nih.gov/,进行注册或登录,操作如下:如果你有NCBI账号可以直接登录如果你没有NCBI账号,就进行注册操作你可以选择以下注册平...

    NCBI 数据上传
  • NCBI|16S原始数据上传

    NCBI|16S原始数据上传

    16S原始数据上传NCBI小编这两天为大家演示了宏基因组数据上传的操作,今天为大家演示16S数据上传的操作,供大家参考,而宏基因组和16S数据上传大同小异,最大的不同就是表格的填写,大家要仔细观察哦~01.申请Biosample编号1.首先...

    NCBI 数据上传
  • NCBI|转录组原始数据上传

    NCBI|转录组原始数据上传

    转录组原始数据上传NCBI数据上传NCBI系列又来啦!今天小编来为大家演示的是转录组原始数据上传NCBI哦~01.申请Biosample编号1.首先我们需要进入NCBI网页https://www.ncbi.nlm.nih.gov/,进行注册...

    NCBI 数据上传
  • R语言直方图绘制函数——hist

    R语言直方图绘制函数——hist

    直方图介绍1、直方图又称柱状图,或质量分布图,是一种统计报告图,由一系列高度不等的纵条纹或线段表示数据的分布情况。直方图是用来展示连续数据分布的常用工具,用来估计数据的概率分布。2、在R中,hist()函数绘制数据的直方图,其实用格式是:h...

    R语言 R语言绘图
  • R语言绘制分组柱状图示例

    R语言绘制分组柱状图示例

    鉴于ggplot2更易于操作,所以本篇主要阐述ggplot2的方法。已知ggplot2柱状图三种样式:geom_col(position = ‘stack‘)、geom_col(position = ‘fill‘

    R语言 R语言绘图
  • barplot柱状图+散点图+误差棒

    barplot柱状图+散点图+误差棒

    今日绘图代码如下rm(list=ls()) #清除环境op=par(mar=c(5,5,1,1))#设置图离边缘的距离#做一个画柱状图的矩阵data <- c(138302457,33047658) #需要用到的所有数据,用excel...

    R语言 R语言绘图
  • R语言绘图-柱状图barplot

    R语言绘图-柱状图barplot

    R 语言柱状图绘制,采用的方法为barplot,可以帮助我们绘制漂亮的柱状图,其详细的绘图参数注解如下:barplot(VADeaths, col = NULL, #col: 设置条形底纹或者填充颜色。 bor...

    R语言 R语言绘图
  • R包的安装方法(1)

    R包的安装方法(1)

    导 语R实际是通过命令操作软件,命令实际是在调用函数。R包是R函数、数据、预编译代码以一种定义完善的格式组成的集合,包括R程序,运行该程序的其他语言(比如Java/C/Fortran),解释这个程序功能、方法的帮助文档,例子,测试数据等。只...

    R语言 R包
  • 富集分析的弦图

    富集分析的弦图

    0.需求解读左边是几个GO term,右边是基因。每个term一个颜色,基因的颜色按照logFC渐变。基因与term之间有连线,就是他们之间有从属关系。1.数据和R包准备1library(clusterProfiler)2library(o...

    R语言绘图 富集分析
  • TCGA数据的一致性聚类和可视化

    TCGA数据的一致性聚类和可视化

    1.输入数据目前从网上找到的代码大多是帮助文档的示例数据ALL,是个log过后的表达芯片数据,作者取了mad最大的5000个基因,并且把每个基因的表达量减去了中位数,使数据分布范围在0上下。芯片数据,就照这个样子处理。那RNA-seq数据呢...

    R语言 R语言绘图 TCGA
  • TCGA数据的NMF聚类和可视化

    TCGA数据的NMF聚类和可视化

    0.NMFNMF是非负矩阵分解,也是常用的划分亚组(亚型)的聚类方法之一咯。1.输入数据这里使用的还是KIRC的fpkm数据和临床信息,下载自xena。rm(list=ls())dat = read.table('TCGA-KIRC...

    R语言 R语言绘图 TCGA
  • R语言数据类型及其转换

    R语言数据类型及其转换

    1.数据类型数值型 Numeric 如 100, 0, -4.335双精度型 double整型 integer字符型 Character 如 “China”逻辑型 Logical TRUE, FALSE,NA因子型...

    R语言
  • 使用 ezcox 进行批量 Cox 模型处理

    使用 ezcox 进行批量 Cox 模型处理

    Cox 模型是我们做生存分析最常用的模型,在实际的分析工作中,我们常常想逐一查看多个变量对生存时间的影响。注意,这与多变量分析不同,后者是通常将多个变量纳入模型查看它们的影响。基于我自己的分析需求,几个月前我编写了一个批处理的函数,最近我将...

    R语言 R语言绘图