生物信息分析流程(Pipeline)全景指南

更新时间:2025年4月22日 15:02 | 领域覆盖:基因组、转录组、单细胞等


一、测序数据预处理与质控

NGS数据标准化流程

  1. FastQC + MultiQC
    • 用途:原始测序数据质量评估与报告整合
    • 流程:FastQC单样本质控 → MultiQC多样本汇总 → 生成HTML交互报告
    • 适用场景:全基因组测序(WGS)、RNA-Seq、ChIP-Seq
    • 特点:支持批量处理,兼容Illumina/Nanopore平台

二、基因组比对与变异分析

人类全基因组分析标准流程

  1. BWA-MEM → GATK Best Practices
    • 步骤
      • 比对:BWA-MEM生成BAM文件
      • 标记重复:Picard MarkDuplicates
      • 变异检测:GATK HaplotypeCaller
      • 过滤:VQSR或硬过滤(Hard Filtering)
    • 输出:SNV/Indel VCF文件
    • 扩展:可集成ANNOVAR进行功能注释

abc

三、转录组学分析

RNA-Seq差异表达分析流程

  1. HISAT2 → StringTie → DESeq2
    • 核心步骤
      • 比对:HISAT2(或STAR)进行reads定位
      • 转录本组装:StringTie生成GTF文件
      • 定量:featureCounts或Salmon计算基因/转录本表达量
      • 差异分析:DESeq2/edgeR进行统计学建模
    • 高级模块
      • 可变剪切分析:rMATS
      • 富集分析:clusterProfiler

四、单细胞与空间组学

10x Genomics单细胞标准流程

  1. Cell Ranger → Seurat/Scanpy
    • 步骤分解
      • 数据生成:Cell Ranger count生成基因表达矩阵
      • 质控:过滤低质量细胞(线粒体基因比例 >20%)
      • 降维聚类:PCA → UMAP/t-SNE → Leiden聚类
      • 注释:SingleR或手动标记细胞类型
    • 扩展应用
      • 轨迹推断:Monocle3或PAGA
      • 空间转录组整合:Squidpy空间邻域分析

五、宏基因组与微生物组

Shotgun宏基因组分析流程

  1. KneadData → MetaPhlAn4 → HUMAnN3
    • 关键步骤
      • 去宿主:KneadData过滤宿主DNA
      • 物种组成:MetaPhlAn4生成物种丰度表
      • 功能分析:HUMAnN3解析代谢通路
    • 特色工具
      • 抗性基因检测:AMRPlusPlus
      • 可视化:Pavian交互式图表

六、表观基因组学

ChIP-Seq峰值分析流程

  1. Bowtie2 → MACS3 → ChIPseeker
    • 流程详解
      • 比对:Bowtie2或BWA比对到参考基因组
      • 峰值检测:MACS3识别结合位点
      • 注释:ChIPseeker关联基因启动子/增强子
    • 高级分析
      • Motif分析:HOMER或MEME Suite
      • 差异结合:DiffBind

七、流程管理与自动化

可重复性流程框架

  1. Nextflow/Snakemake + Docker
    • 核心架构
      • 流程定义:Nextflow/Snakemake编写DAG任务依赖
      • 环境隔离:Docker/Singularity容器化部署
      • 资源调度:集成SLURM或AWS Batch
    • 典型案例
      • nf-core社区预配置流程(如nf-core/rnaseq)

八、可视化与报告生成

交互式结果展示

  1. R Markdown/Jupyter + Plotly
    • 流程整合
      • 动态报告:R Markdown/Jupyter嵌入代码与图表
      • 可视化库:Plotly生成可交互热图/三维散点图
      • 自动化:通过Makefile或Airflow调度报告生成

  1. 所有流程均基于开源工具(MIT/GPL/Apache协议),建议优先使用最新稳定版本。
  2. 资源需求标注:
    • 🌩️ 表示支持云计算(如AWS、Google Cloud)
    • 📦 表示提供Docker/Singularity镜像
  3. 完整代码示例详见 开源生信流程库