概要
このワークフローは、2つのサンプルから得られた BS-Seq リードデータを入力として、各サンプルのシトシンメチル化率の推定と、サンプル比較によるメチル化変化領域の検出を行います。産総研が開発した BS-Seq 解析パイプライン「Bisulfighter」を Galaxy ワークフローとして移植したものです。
ワークフローは、シトシンメチル化率の推定を行う「bsfcall」と、メチル化変化領域の検出を行う「commet」から構成されます。
- bsfcall
- リードをレファレンスゲノムにマッピングして、それぞれのシトシンにおける C–C マッチと C–T ミスマッチのカウントに基づいてメチル化率の推定を行う。
- 産総研が開発したマッピングツール LAST を使用することにより、高精度な推定を実現している。
- commet
- bsfcall の出力結果をサンプル間で比較して、メチル化が変化しているゲノム領域を検出する。
- HMM に基づく独自のアルゴリズムを採用しており、転写因子結合サイトなど事前に注目すべき領域が分かっていない場合でも、メチル化変化領域の位置を de novo に決定することができる。
入力ファイル
比較したい2つのサンプルを、それぞれサンプル1、サンプル2とする。
- サンプル1の BS-Seq リード (fastqsanger)
- サンプル2の BS-Seq リード (fastqsanger)
出力ファイル
- サンプル1のシトシンメチル化率推定結果 (tabular)
- サンプル2のシトシンメチル化率推定結果 (tabular)
- サンプル1とサンプル2の比較によるメチル化変化領域検出結果 (tabular)
- 各シトシンサイトにおけるメチル化変化の状態 (tabular)
フロー図
テスト方法
- Download References ツールを使って Bisulfighter Index Test をダウンロードします。(初回実行時のみ)
- ツールパネルのダウンロードボタンからURLテキストボックスに以下のURLを入力して、ファイルフォーマットにfastqsangerを指定して各ファイルをダウンロードします。
http://download.pitagora-galaxy.org/data/workflows/BS-seq_01/1.fastq.gz
http://download.pitagora-galaxy.org/data/workflows/BS-seq_01/2.fastq.gz
- ワークフローを実行します。 [Workflow] > [BS-seq 01] > Step 3/4 bsfcall で test を選択 > [run] をクリックします。