Skip to content

Latest commit

 

History

History
128 lines (95 loc) · 14.5 KB

README_cn.md

File metadata and controls

128 lines (95 loc) · 14.5 KB

Whole Genome Sequencing

WGS分析过程

  1. 实验准备: 在开始分析之前,需要准备样本和相关实验材料。样本可以是DNA的提取物,通常从血液、组织或细胞中提取。实验准备包括质量控制检查、DNA文库构建和测序芯片准备等。

  2. DNA文库构建: 将样本的DNA片段转化为适合测序的文库。这通常包括以下步骤: a. DNA片段切割:将长的DNA片段切割成较短的片段,通常为几百到几千碱基对。 b. 末端修复:修复DNA片段的末端,使其适合连接测序适配体。 c. 适配体连接:将测序适配体连接到DNA片段的末端,适配体包含与测序仪器兼容的序列。 d. PCR扩增:通过聚合酶链式反应(PCR)扩增适配体连接的DNA片段,以便在测序中产生足够的信号。

  3. 测序: 将DNA文库放入测序仪器进行测序。有几种不同的测序技术可供选择,例如Illumina、Ion Torrent、PacBio和Oxford Nanopore等。这些技术使用不同的原理和方法来读取DNA序列。

  4. 数据预处理: 从测序仪器中生成的原始测序数据称为"reads"。在进行进一步的分析之前,需要对这些数据进行预处理和质量控制,以去除低质量的reads和适配体序列。

    1. Trimmomatic:用于去除测序reads中的适配体序列、低质量碱基和低质量reads。你可以在 Trimmomatic GitHub 上找到更多信息和使用说明。

    2. FastQC:用于评估测序reads的质量分布和其他质量指标。它可以帮助检测测序过程中的潜在问题,如测序质量下降、适配体污染等。有关更多信息,请访问 FastQC网站

    3. BWA-MEM:用于将测序reads比对到参考基因组上。BWA-MEM采用快速的seed-and-extend算法,能够高效地处理较长的reads。你可以在 BWA-MEM GitHub 上获取详细的文档和使用说明。

    4. Bowtie2:用于将reads比对到参考基因组。它结合了快速的seed-and-extend算法和最大可信权值路径算法,适用于短序列的比对。你可以在 Bowtie2官方网站 上了解更多信息。

    5. SAMtools:用于处理比对结果的工具集,可以进行SAM/BAM格式文件的转换、排序、索引和过滤。此外,它还提供了一系列命令行工具,用于统计比对信息、检测SNPs和Indels等。你可以在 SAMtools官方网站 上找到更多的文档和下载链接。

    6. GATK(Genome Analysis Toolkit):是一个用于基因组数据的分析和变异检测的工具集。它提供了多种算法和工具,包括基因组重比对、SNP/Indel检测、变异过滤等。有关详细信息,请访问 GATK官方网站

    7. Picard Tools:用于处理SAM/BAM文件的工具集,可以标记PCR重复、计算覆盖度、创建统计报告等。你可以在 Picard Tools官方网站 上了解更多信息和使用说明。

    8. QualiMap:用于评估测序数据质量的工具,可以检测测序reads的覆盖度、GC含量、错误率等质量指标,并生成相应的统计图表和报告。有关更多信息,请访问 QualiMap官方网站

  5. 数据比对和基因组装: 将预处理后的reads与参考基因组进行比对或基因组装。比对是将reads与已知基因组序列进行比较,确定每个read在基因组中的位置。基因组装是将reads组合成更长的连续序列,以重建基因组的整体结构。

    1. 比对工具:
      1. BWA-MEM:用于将测序reads比对到参考基因组上。它采用快速的seed-and-extend算法,适用于处理较长的reads。你可以在BWA-MEM GitHub上获取详细的文档和使用说明。
      2. Bowtie2:用于将reads比对到参考基因组。它结合了快速的seed-and-extend算法和最大可信权值路径算法,适用于短序列的比对。了解更多信息,请访问Bowtie2官方网站
    2. 基因组装工具:
      1. SPAdes:用于从测序reads中进行基因组组装,包括单细胞测序数据。它结合了de Bruijn图算法和多种优化策略,适用于各种类型的测序数据。你可以在SPAdes GitHub上找到更多信息和使用说明。
      2. Velvet:基于de Bruijn图的基因组组装工具,适用于短序列测序数据。它通过构建k-mer图来重建基因组序列。有关详细信息,请访问Velvet官方网站
      3. SOAPdenovo:一个用于基因组组装的快速和高效的工具。它基于de Bruijn图算法,适用于大规模基因组的组装。了解更多信息,请访问SOAPdenovo官方网站
  6. 变异检测: 使用比对或基因组装的结果,识别和分析样本中的基因组变异。这些变异可能包括单核苷酸多态性(SNPs)、插入/缺失(indels)、基因重排等。变异检测的方法和工具会根据研究目的而有所不同。

    1. GATK(Genome Analysis Toolkit):GATK是一个广泛使用的工具集,用于基因组数据的分析和变异检测。它提供了多种算法和工具,包括基因组重比对、SNP/Indel检测、变异过滤等。了解更多信息,请访问GATK官方网站
    2. VarScan:VarScan是一种用于检测SNPs、Indels和结构变异的工具,特别适用于对比分析。它能够从比对数据中识别变异,并提供统计学过滤和注释。有关详细信息,请访问VarScan官方网站
    3. FreeBayes:FreeBayes是一个开源的SNP和Indel检测工具,能够从测序数据中检测变异。它采用贝叶斯统计方法进行变异检测,并提供了高灵敏度和准确性。了解更多信息,请访问FreeBayes GitHub
    4. MuTect:MuTect是一个专门用于检测肿瘤样本中的突变的工具。它可以分析肿瘤-正常对比数据,并鉴定出肿瘤样本中的突变。了解更多信息,请访问MuTect官方网站
    5. Samtools:Samtools是一个用于处理比对数据(SAM/BAM格式)的工具集,同时也提供了一些变异检测功能。它可以进行SNP/Indel检测、过滤和注释等。有关详细信息,请访问Samtools官方网站
    6. Platypus:Platypus是一个灵活的变异检测工具,可以从WGS数据中检测SNPs、Indels和结构变异。它具有高度可配置性,并且支持多样本分析。了解更多信息,请访问Platypus GitHub
  7. 注释和功能分析: 对检测到的变异进行注释,确定其可能的功能和影响。注释可以包括变异在基因区域的位置、氨基酸改变的影响、潜在的功能通路等。

    1. ANNOVAR:ANNOVAR是一个用于注释基因组变异的工具,可以根据各种数据库提供详细的注释信息。它支持多种变异类型的注释,包括SNP、Indel、结构变异等。了解更多信息,请访问ANNOVAR官方网站
    2. Variant Effect Predictor (VEP):VEP是一个广泛使用的工具,用于注释和预测变异的功能影响。它能够提供详细的注释信息,包括变异的基因影响、功能改变、突变致病性预测等。了解更多信息,请访问VEP官方网站
    3. SnpEff:SnpEff是一个用于注释和预测SNP和结构变异的功能影响的工具。它能够提供变异的注释、基因影响、功能改变以及通路分析等。有关详细信息,请访问SnpEff官方网站
    4. dbNSFP:dbNSFP是一个基因组功能预测数据库,提供了大量的注释和预测信息。它包含了来自多个公共数据库的功能预测结果,并提供了丰富的注释信息,如SIFT、PolyPhen-2、GERP++等。有关详细信息,请访问dbNSFP官方网站
    5. DAVID:DAVID(Database for Annotation, Visualization, and Integrated Discovery)是一个功能注释和富集分析工具,可以帮助用户理解基因组变异的功能和相关的生物学过程。它整合了多个公共数据库,提供了注释、功能分析和通路分析等功能。了解更多信息,请访问DAVID官方网站
  8. 结果解读和报告: 根据分析的结果,对基因组测序数据进行解读,并形成报告。报告可能涵盖样本的遗传风险、潜在的致病变异、药物敏感性等信息。

标准WGS生物信息分析流程

流程图

WGS标准流程在线分析地址

WholeGenomeSequencingFlow

https://www.flowhub.com.cn/repo/flowhub_team/WholeGenomeSequencingFlow

WGS标准流程使用教程

如何使用FlowHub快速完成数据分析

  • Step1:点击流程链接,进入FLOWHUB标准流程订阅界面,点击“subscribe”,订阅flow。 step1

  • Step2:如果您没有FlowHub平台账号,订阅不会成功,将会进入FLOWHUB平台登录界面,已经有账号的直接账号密码登录进入平台,无账号点击“sign up”根据指引完成注册。

    step2
  • Step3:登录进入平台,再次进入FLOWHUB标准流程订阅界面,再次点击“subscribe”,进行订阅,点击“Sure”完成订阅。 step3

  • Step4:订阅完成后进入Community-Subscribe Manage界面,添加对应标准流程进平台项目中,根据指引,点击“Sure”创建新项目。 step4

  • Step5:根据指引完成新项目创建。 step5

  • Step6:完成新项目创建后,根据指引再次添加flow进入新创建项目中。 step6

  • Step7:添加成功以后,点击右上方“PROJECT”,出现项目列表,快速进入流程所在的项目。 step7

  • Step8:进入项目后,在Flie中上传需要处理的数据文件。进入job,点击“create job”创建任务。 step8

  • Step9:点击“choose flow”,根据指引选择对应流程,点击“next step”进行输入文件选择。 step9

  • Step10:

  1. 在OutPut folder指定任务的所有输出文件的根目录;
  2. 在Input Flie根据端点名称,选择输入文件;
  3. 在Output Flie对需要标记的输出文件进行重命名; step10-1
  4. 查看job内使用的tool,进行个性化参数调整,CPU/GPU调整,如执行标准化流程无需更改。 step10-2

Fowhub平台介绍

FlowHub 是一种创新的工作流云平台,为用户提供了全面而强大的功能。它不仅是一个可靠的数据管理平台,还是一个灵活的工具开发平台,一个高效的流程构建平台,一个智能的任务调度平台以及一个直观的数据可视化平台。

作为数据管理平台,FlowHub 提供了强大的数据存储和处理能力,用户可以安全地存储和管理各种类型的数据。通过直观的界面和易于使用的工具,用户可以轻松地对数据进行增删改查、导入导出等操作,实现对数据的全面管理。

作为工具开发平台,FlowHub 提供了丰富的开发工具和接口,使用户能够自定义和扩展平台的功能。用户可以使用自己熟悉的编程语言和技术,开发和集成各种工具、插件和扩展,以满足自己特定的需求。

流程构建是 FlowHub 的核心特性之一。它提供了直观的图形化界面,使用户能够以可视化的方式设计和构建工作流程。通过简单的拖放操作,用户可以将不同的任务和操作连接起来,形成完整的工作流程。这种图形化的方式不仅提高了工作效率,还降低了错误发生的概率。

任务调度是 FlowHub 的另一个重要功能,它能够智能地管理和调度任务的执行。用户可以设置任务的优先级、依赖关系和调度规则,FlowHub 将自动根据这些设置来合理安排任务的执行顺序和时间,以确保工作流程的顺利进行。

除此之外,FlowHub 还提供了强大的数据可视化功能。用户可以通过直观的图表、图形和报表,将复杂的数据转化为可理解和易于分析的形式。这使得用户能够更好地理解数据、发现潜在的模式和趋势,并做出基于数据的明智决策。

总之,FlowHub 是一个功能丰富、易用而强大的工作流云平台,为用户提供了全面的数据管理、工具开发、流程构建、任务调度和数据可视化能力,帮助用户更高效地处理和分析数据,提升工作效率和决策能力。

联系我们

官方网站: https://www.tanjubio.com

email: [email protected]

电话: 17399981010

微信:

添加微信