pitagora-network.github.io

既存ワークフローまとめ

  1. RNAseq – これは RNA-seq 01 と同様なので考慮しない
  2. KazusaWF – BWA を実行するだけのWFなので気にしない
  3. LAST(Single) – Lastal + maf convert + sam-to-bam + samtools sort
  4. LAST(Paired) – LAST(Single) の途中で LAST pair probs というのが入る
  5. GATKs – GATK Realignment + Picard 重複排除 + GATK Recalibration(重複排除では先でもいい気がする)
  6. GATK Variants – GATK Genotyping + GATK Select Variants + SnpShift Annotation
  7. VarScan – MPileup + VarScan + ProcessSomatic(って何?自作のフィルタリング?

今後の作業

  1. まず、入力を BAM にして Variant 検出フローのどちらか(5+6 or 7)を動かす。とりあえず、GATK = 5+6 を先にする
    • Picard は ToolShed のものを使う(picard)
    • GATK は自作のものを使う?(ToolShed にあるのは Version 1.4 / 2 対応。自作は確か 1.6 だったはず)
    • SnpSift は ToolShed のものを使う(snpsift リストには snpeff パッケージもあるけれど使っている?
  2. 次に、BAM vs LAST の部分を作る。Lastal と maf convert は新規ツールが必要
    • LAST のツールについては齋藤さんと共有できる部分があるか確認
  3. これらをつなげて実行できるようにする
  4. 残りの Variant 検出フロー VarScan = 7 を同様に動かして、Mapper とつなげて実行できるようにする
    • VarScan は ToolShed のものを使う(varscan_version2 / varscan_wrapper リストに両方あるがどっちを使っている?
    • MPileup は ToolShed のものを使う(samtools_mpileup)

作業ログ