events
主旨
ツールやワークフローを持ち寄って仮想マシンに加える
(図)
実際には、加えるための手順を作って、仮想マシンの管理者と共有する
同時に、Wiki に新しいツールやワークフローの説明を記載する
プロジェクトを改善するためのフィードバックを収集する
解析プラットフォーム管理に役立つ技術ネタを共有する
Galaxy 以外のソフトウェアを扱っていく可能性について議論する
スケジュール
日時: 2015年11月19日(木)
場所: 先端研4号館4階セミナールーム
連絡先: 山中 yamanaka [at] genome.rcast.u-tokyo.ac.jp
Skype ID:pitagora-network(
最新バージョンのSkype
の使用を推奨)
10:00-10:15
主旨のリマインド + 今日の作業確認
10:15-18:00
ツールの開発
18:00-18:30
今日のまとめ + 次回の日程調整
(Skype 参加可)
18:30-20:30
有識者会議
内容
全体
積み残しタスク
山中
Wiki のトップページから「勉強用資料一覧」のページを作る?
ピタゴラのファイルシステム上でどこになにがあるかをwikiに転載する。ファイル・ツリーを書く(Galaxyの決め事か、ピタゴラの決め事か)
大田
分生の準備をします
http://wiki.pitagora-galaxy.org/wiki/index.php/Presentations/BMB2015
手頃で扱いやすいテスト用データをこしらえる
芳村
GalaxyDockerコンテナ上でSailfishのDocker in Dockerをツールとして動作させる
ベースのツール
https://github.com/myoshimura080822/tools_of_rnaseq_on_docker_galaxy/tree/master/Sailfish_Wrapper
コンテナ化はjob_conf.xml とWrapperを修正すればいけることがわかった
既存のWF実行も問題なし
並列で実行してコンテナが3個走ってることも確認
注意
SailfishのindexDirが子docker run時にマウントされている必要がある
Todo
今ToolShedに上がっているSailfish Wrapperについてもdocker対応を加える
並列jobでコアを食い尽くす危険があるので、job_conf.xmlを適切に設定する必要があることを明記
石井
Galaxy Docker連携に関しての問題意識の共有ができた w/ 那須野さん
鈴木
ウイルス解析用ツール
ウイルス(例
Porcine epidemic diarrhea virus (PEDV)
)のアセンブリには、
VirAmp
や
viralcloud
よりも
USDA pipeline
(未発表)が良い?
ファージ
Center for Phage Technology (CPT) Galaxy Server
微生物NGS解析
Orione
の
ワークフロー
を実行し、I reported the error “An error occurred with this dataset: Error running velvety” using the dataset’s bug icon on 2015-08-24.
画面右上の歯車マーク(History options)の Saved Histories → [Delete]した後、[Delete Permanently](画面右上を“Using 0%”に)することは可能?
Delete vs Delete Permanently
小さいテストデータを用意。
“Not writing tests”
“Create tests, small datasets for which the answer is known, and check that the software or pipeline can reproduce that answer.”
Galaxyチュートリアル資料(日本語)
2015-01-27
GalaxyによるNGS解析
2014
Galaxyの使い方
生物研(農業生物資源研究所)
2010-10-25
Galaxyを動かしてみました - Takeruでこのようなものを動かしてみました
2010-08-09
DBCLS Galaxyではじめるゲノムスケールデータの共同研究
那須野
Galaxy on Aurora/Mesosクラスタ@NIIクラウドは、今週開催中のSC15@Austinで展示しています。
共有ストレージを使わずにNGS解析の分散実行を行うモデルを検討中。
広域に分散するホストに展開したコンテナでパイプラインを実行する際、NFS等の共有ストレージを使わず、オンデマンドにデータをレプリケーションするような実行モデルを考えたい。
まずは、これまで触ったことがあるRNA-SeqやFANTOM5をベースに考えてみる。
候補となる方式
DRBD
lsyncd + rsync
Galaxy Pulsar (?)
芳村さんのデバッグ作業をお手伝いさせていただきました。
Dockerコンテナ化したSailfishをGalaxy Docker上のLocalJobとして実行できることを確認。
小寺
ゲノムが読まれてない生物種のRNA-seqで、Trinity - RSEM を用いて発現量を計算するワークフローは作ったが、今度は、同一生物種で複数条件の RNA-seq を比較するワークフローを作ってみる。
圧縮ファイルの取り扱いについて
池田
STAR GATKワークフローの作成
新海
GATKまわりの、(ピタゴラ環境に移植した)調達版の動作確認と、ピタゴラ版を動作させる為の調整。
tool_dependencies経由でインストールされたGATKファイルを参照して自作ツールを動かす方法について山中さんに相談中。