0% found this document useful (0 votes)

111 views1 page

Metagen Overview

This document provides an overview of a generic metagenomics workflow that involves sequencing samples, quality filtering the reads, performing either read-based analysis without assembly or assembling reads into contigs followed by mapping reads back to the assembly and recovering genomes. Key steps include demultiplexing samples, quality filtering reads, performing either read-based analysis using tools like metaphlan2 or assembling reads using tools like Megahit, mapping reads back to assemblies, and recovering genomes from assemblies. The document notes that specific workflows may vary in the order and details of steps.

Uploaded by

Evelyn Hernández Zúñiga

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

111 views1 page

Metagen Overview

Uploaded by

Evelyn Hernández Zúñiga

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 1

Overview of generic* metagenomics workflow When working with your own data you should never follow any

When working with your own data you should never follow any pipeline
*This is generic; specific workflows can vary on blindly. There can be critical differences based on your data.
the order of steps here and how they are done.
might be done by sequencing facility
sequencing demultiplex quality filter/trim
facility fastq files (split samples by barodes) (remove adapters/primers) fasta/q files
fastqc/multiqc
@HISEQ2500:282:1:1101:1220:1944 1 Some tools: Some tools: >HISEQ2500:282:1:1101:1220:1944 1
ATCGGATCG... ATCGGATCG...
+ • sabre • trimmomatic
<G.<G<AGGII... • fastx_demux (usearch/vsearch) • bbduk.sh (bbtools suite of tools)
• idemp
• fastx barcode splitter (fastx-toolkit)

read-based no-assembly path

analysis
Some tools: consider testing assemblies with and w/o
Some tools:
• TIPP/SEPP assembly
• metaphlan2
path digital normalization • bbnorm
• diginorm
• humann2
• sourmash
• kraken Count Table MetaQUAST is a great
Sample_A Sample_B ... tool for comparing
obj_1 0 428 ... assemblies
Analysis obj_2 306 323 ...
map individual sample reads to (co)-assembly
Generate coverage
Some tools: obj_3 217 1 ... (co)-assembly
• phyloseq • SpiecEasi
... ... ... ...
information (mapping)
• Breakaway • MaAsLin Some assemblers and tools:
• DivNet • DESeq2 • Megahit (assembler) Some tools:
• CORNCOB • SPAdes (assembler) • bowtie2
• idba-ud (assembler) • bwa
• MetAMOS (assembler and analysis pipeline)
• MetaCompass (reference-guided)
Gene calling • MetagenomeScope (visualize assembly graphs)
Recovering genomes A note on MAGs:
MAGs (metagenome-assembled genomes) are
Functional/taxonomic from metagenomes not the same thing as isolate genomes. They are
composite representative genomes of closely
profiling Some tools:
related genomic lineages.
• anvi'o (interactive manual curation of bins; and much more)
Some tools: Some common genomics stuff • CONCOCT (kmer-based and coverage-based binning; also incorporated in anvi'o)
• prodigal (identifies open reading frames) • COCACOLA (kmer-based, coverage-based, and incorporates paired-read linkage of contigs)
• prokka (runs prodigal and performs annotations) • MetaBAT2 (kmer-based and coverage-based binning tool)
• GHOSTKOALA (web-hosted KEGG annotations)
• BLAST (protein nr db/refseq/COGs)
Phylogenomics • BinSanity (primarily coverage-based, optional second round kmer-based binning tool)
• checkm (genome-level taxonomy; and much more)
Comparative • DASTool (a tool for evaluating bins recovered by different methods)
• DESMAN (tool aimed at resolving strains)

Size Mb ( ) GC % ( ) Proportion of Overall relative

genomics II (7) CRD1 (4) IV (2) III (1) X (1) ref. genome
overall rel. abund.
15%
0 4 8

Pangenomics
0
I (4) XV (2) WPC1 (1) UC-A (2) 04 ANE
2.0 2.5 3.0 genome detected abundance ANW 141
141
ANW
Clade 50 60 70 0.25 0.50 0.75 5% 10% IOS 57

% recruited of sample reads

PON 140
RED 33 68 ASE

A KORDI52 WPC2 B n =5 C D Environmental

ION 38
PSW 124
ECG/EAG
38
ASW
ION
Core
CC9605 35
Genes
RCC307
MIT9509 57 IOS

Env. distributions
UW179A
WH8109 35
Environmental MIT9508
GEYO
25
140
MED

N32 38 Accessory
Genes
WH8016 132
UW179B
PON

N5
UW86
II 36
37
WH8020
CC9311
KORDI49 93
CC9616 124
PSE

PSW
II CRD1 IV III X WPC-1 I XV UC-A
KORDI100
RED
N26 36 WH8102 33 25

Presence/Absence
CC9902 APase (phoD)
BL107 Nirtate/Nitrite trans. (ntrABC)
N19 36 UW69
2 Mn trans. (corA)

5.1A Gluconate dehydrogenase (kduD)

Gene
UW106
1,002 1:1 orthologs UW106 14 CC9605
Lactate dehydrogenase (dld)
Cb/Zn/Cd efflux (czcD) 33
132
354,229 AA UW69 XV WH8109
N32 2 2 33
2 2 25 Arylsulfatase (aslA)
3 2 2 6 2 2 2 5 3 5 5 2 Ferritin (ftn)
142 04
Some tools:
16 N5 Catalase peroxidase (katG)
UW86

KORDI100

KORDI49

UW179A
WH8020
UW179B
WH8016
WH8109

WH8102

MIT9508

MIT9509
RCC307
CC9311
CC9605

CC9902

CC9616
N26

UW106
BL107

GEYO
BL107
UW86

UW69
18

N19
N26

N32
IV

N5
N19

CC9902 20

• anvi'o (integrated HMMs for common single-copy gene sets; integrated

0.7
Chl.
Si
III

Spearman
WH8102 19
0
O2
Salinity 141
KORDI100 10 14,036 GCs PO4-3
Temp.
UC-A
pangenomic workflow for identifying orthologs via OrthoMCL)
Fe
31 genomes -0.7
CC9616 11
24 84,784 totalgenes 38
KORDI49 WPC1 20
140 57
• PanOCT (identifies orthologs utilizing synteny information)

UWN26 9
CC9311

N1
9

86
W N3N5
CC H810 2
UW 05 9
= 100 WH8020 15
I

UW 106
52

69
48

W 99 7
CCBL10
KO H8 02
UW179B
• StrainPhlAn/PanPhlAn (tools for strain-level analyses)

CC I1 2
2

RD 10
KO 96 00
RD 16
W 93 9
CC I4
UWH802 11
WH8016

W 17 0
2 Core

H8 9B
M GE 6
01
UWIT95 YO
124 76

MI 17 08
V 1,106 GCs

T9 9A
WH7803 2

9
• MUSCLE (alignment software)

50
35,140 genes
WH7805 VI 1 % recruited of total reads
78
GEYO 33 9.0 68
MIT9508
UW179A
CRD1
31
5
5.1B
• FastTree (very fast, pseudo-maximum likelihood tree builder) Unique
RC
C30
7
6.0
3.0
93

0.1
MIT9509
RS9917 VIII
14
0
• RAxML (maximum likelihood tree builder) 7,986 GCs
8,181 genes
0.01
= Not detected
RS9916
UW105
IX 5
6 • Mauve (whole-genome alignment)
UW140 XVI 5

RCC307 X 28 5.3
astrobiomike.github.io

Zoology Paper 1 Topic Wise Upsc Questions: Syllabus Non-Chordata and Chordata
100% (3)
Zoology Paper 1 Topic Wise Upsc Questions: Syllabus Non-Chordata and Chordata
16 pages
Genomics
No ratings yet
Genomics
43 pages
Bioinformatics in PAM AND BLOSUM
100% (15)
Bioinformatics in PAM AND BLOSUM
17 pages
SM - CMT 05101 Epidemiology and Biostatistics
No ratings yet
SM - CMT 05101 Epidemiology and Biostatistics
188 pages
Genomic Databases - Analysis Tools
No ratings yet
Genomic Databases - Analysis Tools
87 pages
BioInformatics Quiz1 Week1
No ratings yet
BioInformatics Quiz1 Week1
6 pages
Module 3 Session.3 Updated Practical Assignment 2022 Lucy Nakabazzi
100% (3)
Module 3 Session.3 Updated Practical Assignment 2022 Lucy Nakabazzi
5 pages
1 s2.0 S0960852421019544 mmc7
No ratings yet
1 s2.0 S0960852421019544 mmc7
195 pages
Basics of Bioinformatics
100% (7)
Basics of Bioinformatics
99 pages
Metagenomics Thesis PDF
75% (4)
Metagenomics Thesis PDF
11 pages
Diapositivas 09 An Lisis de Datos Aplicados A La Metagen Mica
No ratings yet
Diapositivas 09 An Lisis de Datos Aplicados A La Metagen Mica
82 pages
Introduction To Metagenomics
No ratings yet
Introduction To Metagenomics
38 pages
Anotacion de Genomas
No ratings yet
Anotacion de Genomas
84 pages
Novogene Amplicon Standard Analysis DEMO REPORT
100% (1)
Novogene Amplicon Standard Analysis DEMO REPORT
37 pages
Bio Statistics
No ratings yet
Bio Statistics
33 pages
Biotechnologia MSC 2017 Ora2 MG
No ratings yet
Biotechnologia MSC 2017 Ora2 MG
59 pages
4 8.syllabus MD Niper-G
No ratings yet
4 8.syllabus MD Niper-G
19 pages
02plastico Apendice
No ratings yet
02plastico Apendice
22 pages
Sequencing Workflow D 02 3
No ratings yet
Sequencing Workflow D 02 3
36 pages
Intro To RNA-seq Concepts
No ratings yet
Intro To RNA-seq Concepts
85 pages
The Best Practice For Microbiome Analysis Using R
No ratings yet
The Best Practice For Microbiome Analysis Using R
13 pages
Advances in Applied Microbiology, 1st Edition Official Download
100% (8)
Advances in Applied Microbiology, 1st Edition Official Download
15 pages
Chin 2013
No ratings yet
Chin 2013
9 pages
Assignment CB 1
No ratings yet
Assignment CB 1
69 pages
Final Biostatistics Lecture Notes
No ratings yet
Final Biostatistics Lecture Notes
71 pages
High-Quality Metagenome Assembly From Long Accurate Reads With metaMDBG
No ratings yet
High-Quality Metagenome Assembly From Long Accurate Reads With metaMDBG
20 pages
M.SC Transcriptome Analysis 2025
No ratings yet
M.SC Transcriptome Analysis 2025
21 pages
生工生物宏全基因组测序项目分析报告模板 (01 36)
No ratings yet
生工生物宏全基因组测序项目分析报告模板 (01 36)
36 pages
Spectrum 01434-21
No ratings yet
Spectrum 01434-21
18 pages
HHSM ZG513 Course Handout
No ratings yet
HHSM ZG513 Course Handout
5 pages
Pre-Test Answers
No ratings yet
Pre-Test Answers
12 pages
QUIZ Week 2 CART Practice PDF
No ratings yet
QUIZ Week 2 CART Practice PDF
10 pages
Seminars BNF Lecture2 2022
No ratings yet
Seminars BNF Lecture2 2022
36 pages
Colon Report
No ratings yet
Colon Report
23 pages
Lecture-Metagenomics - Using Mothur
No ratings yet
Lecture-Metagenomics - Using Mothur
48 pages
Project 2
No ratings yet
Project 2
9 pages
Media 1
No ratings yet
Media 1
18 pages
Job PDF
No ratings yet
Job PDF
8 pages
Introduction To Bioinformatics
No ratings yet
Introduction To Bioinformatics
2 pages
List of Online Bioinformatics Tools and Software - Final
No ratings yet
List of Online Bioinformatics Tools and Software - Final
23 pages
Taxonomic Profiling
No ratings yet
Taxonomic Profiling
13 pages
P240015 Report
No ratings yet
P240015 Report
7 pages
ATLAS - A Snakemake Workflow For Assembly, Annotation, and Genomic Binning of Metagenome Sequence Data
No ratings yet
ATLAS - A Snakemake Workflow For Assembly, Annotation, and Genomic Binning of Metagenome Sequence Data
8 pages
Galloway Digestive Diseases Sciences 2020
No ratings yet
Galloway Digestive Diseases Sciences 2020
12 pages
Metagenomics in Microbial Ecology Research
No ratings yet
Metagenomics in Microbial Ecology Research
8 pages
Ncomms 11257
No ratings yet
Ncomms 11257
9 pages
Bioinformatics
No ratings yet
Bioinformatics
3 pages
1 - Introduction To Biostats
No ratings yet
1 - Introduction To Biostats
48 pages
Bioinformatics 32 7 1088
No ratings yet
Bioinformatics 32 7 1088
3 pages
Human Genome Project and DNA Fingerprinting
No ratings yet
Human Genome Project and DNA Fingerprinting
20 pages
Kato Bridgious Exam Bioinformatics
No ratings yet
Kato Bridgious Exam Bioinformatics
17 pages
BBX 120
No ratings yet
BBX 120
15 pages
The Best Practice For Microbiome Analysis Using R
No ratings yet
The Best Practice For Microbiome Analysis Using R
13 pages
Metagenome Notes
No ratings yet
Metagenome Notes
9 pages
A Brief Account On Enzyme Mining Using Metagenomic Approach
No ratings yet
A Brief Account On Enzyme Mining Using Metagenomic Approach
10 pages
Functional Microbial Genomics 1st Edition Brendan Wren PDF Download
100% (1)
Functional Microbial Genomics 1st Edition Brendan Wren PDF Download
62 pages
Software: Next-Generation Sequence Alignment Software
No ratings yet
Software: Next-Generation Sequence Alignment Software
3 pages
ChatGPT Pdf-Binning
No ratings yet
ChatGPT Pdf-Binning
1 page
Functional Metagenomics For Enzyme Discovery: Challenges To Efficient Screening
No ratings yet
Functional Metagenomics For Enzyme Discovery: Challenges To Efficient Screening
7 pages
MAT500 Paper Phylogenetics
100% (1)
MAT500 Paper Phylogenetics
19 pages
Denbi Metagenomics Workshop
No ratings yet
Denbi Metagenomics Workshop
21 pages
Assignment 01
No ratings yet
Assignment 01
6 pages
Bioinformatics: ABE 2007 Kent Koster Group 3
No ratings yet
Bioinformatics: ABE 2007 Kent Koster Group 3
43 pages
Meta Presentation 2
No ratings yet
Meta Presentation 2
14 pages
Galaxy Nanopore
No ratings yet
Galaxy Nanopore
11 pages
Microbial Genomics and Metagenomics 2021
No ratings yet
Microbial Genomics and Metagenomics 2021
4 pages
ChatGPT Pdf-Assembly
No ratings yet
ChatGPT Pdf-Assembly
2 pages
Poster PPT Portrait
No ratings yet
Poster PPT Portrait
1 page
Active Learning Activity 1 Bms551 Principles of Bioinformatics
No ratings yet
Active Learning Activity 1 Bms551 Principles of Bioinformatics
2 pages
Sqmtools: Automated Processing and Visual Analysis of 'Omics Data With R and Anvi'O
No ratings yet
Sqmtools: Automated Processing and Visual Analysis of 'Omics Data With R and Anvi'O
11 pages
MSC Semester-1 Dt.01-02-2025
No ratings yet
MSC Semester-1 Dt.01-02-2025
4 pages
Intro To Using Galaxy - For Bioinformatics: Carrie Ganote
No ratings yet
Intro To Using Galaxy - For Bioinformatics: Carrie Ganote
26 pages
Sem 6
No ratings yet
Sem 6
7 pages
A Review of Methods and Databases For Metagenomic
No ratings yet
A Review of Methods and Databases For Metagenomic
15 pages
A Review of Bioinformatics Tools For Bio-Prospecting From Metagenomic Sequence Data
No ratings yet
A Review of Bioinformatics Tools For Bio-Prospecting From Metagenomic Sequence Data
10 pages
Fgene-10-00904 Advantages Challenges Metatranscriptomics
No ratings yet
Fgene-10-00904 Advantages Challenges Metatranscriptomics
10 pages
Advances in Applied Microbiology 1st Edition ISBN 0124076785, 9780124076785 Entire PDF Ebook
No ratings yet
Advances in Applied Microbiology 1st Edition ISBN 0124076785, 9780124076785 Entire PDF Ebook
15 pages
Genomics For Beginner
No ratings yet
Genomics For Beginner
9 pages
Metagenomics - A Guide From Sampling To Data Analysis
No ratings yet
Metagenomics - A Guide From Sampling To Data Analysis
12 pages
MS BIS Data Science Pathway Curriculum
No ratings yet
MS BIS Data Science Pathway Curriculum
3 pages
7 HomologyModelling 12oct2020
No ratings yet
7 HomologyModelling 12oct2020
8 pages
Microreads ALLPATHS: de Novo Assembly of Whole-Genome Shotgun
No ratings yet
Microreads ALLPATHS: de Novo Assembly of Whole-Genome Shotgun
12 pages
Protein Structure Determination: Goal
No ratings yet
Protein Structure Determination: Goal
8 pages
Dna Toolkit
No ratings yet
Dna Toolkit
1 page
Tanvi MITU22BTBI0101
No ratings yet
Tanvi MITU22BTBI0101
7 pages
Lecture 1
No ratings yet
Lecture 1
12 pages
Practical 3: Biostatistics
No ratings yet
Practical 3: Biostatistics
9 pages
Metagenomics
No ratings yet
Metagenomics
1 page
Python Beyond Limits: Python, #3
From Everand
Python Beyond Limits: Python, #3
AnwaarX
No ratings yet
Wireshark Cookbook: Packet Analysis Bible
From Everand
Wireshark Cookbook: Packet Analysis Bible
Rob Botwright
No ratings yet

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Metagen Overview

Uploaded by

Metagen Overview

Uploaded by

Overview of generic* metagenomics workflow When working with your own data you should never follow any

read-based no-assembly path

Size Mb ( ) GC % ( ) Proportion of Overall relative

% recruited of sample reads

A KORDI52 WPC2 B n =5 C D Environmental

5.1A Gluconate dehydrogenase (kduD)

• anvi'o (integrated HMMs for common single-copy gene sets; integrated

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.