pitagora-network.github.io

Galaxyで微生物NGS解析を実行するOrioneの主たる機能(リード配列の前処理、細菌の再シーケンシング、de novoアセンブリ、RNA-Seq、メタゲノム・メタトランスクリプトーム)を網羅したワークフロー。

Workflow #1 - Preprocessing

W1 - Pre-processing | Paired-end

W1 - Pre-processing | Paired-end | E coli DH10B MiSeq

E coli DH10B MiSeq R1.fastq E coli DH10B MiSeq R2.fastq

Step 1: Input dataset  ForwardReads   E coli DH10B MiSeq R1.fastq Step 2: Input dataset  ReverseReads   E coli DH10B MiSeq R2.fastq

W1 - Pre-processing | Single-end

W1 - Pre-processing | Single-end | B suis HiSeq2000

B suis HiSeq2000 SE.fastq

Workflow #2: Bacterial re-sequencing

W2 - Bacterial re-sequencing | Paired-end

W2 - Bacterial re-sequencing | Paired-end | E coli DH10B MiSeq

E coli DH10B - Reference E coli DH10B MiSeq R1.fastq E coli DH10B MiSeq R2.fastq

Step 1: Input dataset  Forward Reads   E coli DH10B MiSeq R1.fastq Step 2: Input dataset  Reverse Reads   E coli DH10B MiSeq R2.fastq Step 3: Input dataset  Reference Genome   E coli DH10B - Reference Step 10: Check bacterial contigs (version 0.0.1)  Estimated genome size in Mb   4.686137 Step 12: SSPACE (version 1.0.7)  Insert size   550  Variability (e.g. 0.25 for 25%)   0.25 Step 15: Check bacterial contigs (version 0.0.1)  Estimated genome size in Mb:   4.686137 Step 16: Prokka (version 1.4.0)  Fast mode (--fast)   ✔️

W2 - Bacterial re-sequencing | Single-end

W2 - Bacterial re-sequencing | Single-end | B suis HiSeq2000

B suis HiSeq2000 SE.fastq B suis - Reference genome

Step 1: Input dataset  Reads - Single-end   B suis HiSeq2000 SE.fastq Step 2: Input dataset  Reference Genome   B suis - Reference genome Step 10: Check bacterial contigs (version 0.0.1)  Estimated genome size in Mb   3.315175 Step 15: Check bacterial contigs (version 0.0.1)  Estimated genome size in Mb:   3.315175 Step 16: Prokka (version 1.4.0)  Fast mode (--fast)   ✔️

Workflow #3: Bacterial de novo assembly

W3 - Bacterial de novo assembly | Paired-end

W3 - Bacterial de novo assembly | Paired-end | E coli DH10B MiSeq

E coli DH10B MiSeq R1.fastq E coli DH10B MiSeq R2.fastq

Step 1: Input dataset  Left/Forward FASTQ Reads   E coli DH10B MiSeq R1.fastq Step 2: Input dataset  Right/Reverse FASTQ Reads   E coli DH10B MiSeq R2.fastq Step 14: CISA Contigs Integrator (version 1.0.1)  Expected Genome Size (bp)   4686137 Step 15: Check bacterial contigs (version 0.0.1)  Estimated genome size in Mb   4.686137 Step 17: Prokka (version 1.4.0)  Fast mode (--fast)   ✔️

W3 - Bacterial de novo assembly | Single-end

W3 - Bacterial de novo assembly | Single-end | B suis HiSeq2000

B suis HiSeq2000 SE.fastq

Step 1: Input dataset  Reads - Single-end   B suis HiSeq2000 SE.fastq Step 12: CISA Contigs Integrator (version 1.0.1)  Expected Genome Size (bp)   3315175 Step 13: Check bacterial contigs (version 0.0.1)  Estimated genome size in Mb   3.315175 Step 15: Prokka (version 1.4.0)  Fast mode (--fast)   ✔️

Workflow #4: Bacterial RNA-Seq

W4 - Bacterial RNA-Seq | Single-end

W4 - Bacterial RNA-Seq | Single-end | Listeria monocytogenes

Listeria_monocytogenes_EGD_e_uid61583/NC_003210.fna Listeria_monocytogenes_EGD_e_uid61583/NC_003210.ptt Listeria_monocytogenes_EGD_e_uid61583/NC_003210.rnt L monocytogenes_EGD/NC_003210.fastq

Step 1: Input dataset  Reads - Single-end   L monocytogenes_EGD/NC_003210.fastq Step 2: Get EDGE-pro files (version 1.0.1)  RefSeq Genomic Accession ID   NC_003210

Workflow #5: Metagenomics

W5 - Metagenomics

MetagenomicsDataset.fq

配列データ

B suis - Reference genome  >gi56968325_chr1  # 2107794 bp # http://www.ncbi.nlm.nih.gov/nuccore/56968325  >gi_56968493_chr2 # 1207381 bp # http://www.ncbi.nlm.nih.gov/nuccore/56968493  2107794 + 1207381 = 3315175 bp

参考文献