主旨
- ツールやワークフローを持ち寄って仮想マシンに加える (図)
- 実際には、加えるための手順を作って、仮想マシンの管理者と共有する
- 同時に、Wiki に新しいツールやワークフローの説明を記載する
- プロジェクトを改善するためのフィードバックを収集する
- 解析プラットフォーム管理に役立つ技術ネタを共有する
- Galaxy 以外のソフトウェアを扱っていく可能性について議論する
スケジュール
- 日時: 2017年6月7日(水)
- 場所: 東京工業大学 緑が丘キャンパス 緑が丘6号館2階 203ミーティングスペース (map)
- 連絡先: 山中 yamanaka [at] genome.rcast.u-tokyo.ac.jp, 大田 t.ohta [at] dbcls.rois.ac.jp
- Skype ID:pitagora-network(最新バージョンのSkypeの使用を推奨)
|
|
10:00-10:15 |
今日の作業確認 |
10:15-18:00 |
ツールの開発 |
18:00-18:30 |
今日のまとめ (Skype 参加可) |
内容
全体
山中
大田
- 門田さん原稿 (乳酸菌学会誌でのgalaxyチュートリアル) の英文要旨を書いた
- FaQCs (https://github.com/inutano/FaQCs) を toolshed に登録する
- docker化済
- 元々のツール作者が galaxy 用 XML を書いてくれている
- planemo で XML の validate 済
- 動いた、ちゃんと出力も出た、しかし終了ステータスが0でないためか、正常に完了しているのにパネルが赤くなる
- ここを解決すれば登録できそう、あと一息
- パネルが赤くなるのは標準エラー出力にメッセージが出ているのが原因!!!
- tool XML の command の最後に 2>&1 として標準エラー出力を全部1番に送るのがイージーな解決策
- でもこれだと本当にエラーが出たときに困るので FaQCs.pl に手を入れるべきっぽい
- “Warning: unable to close filehandle properly: Bad file descriptor during global destruction” というエラーが標準エラー出力に出ているのが悪い、perlのコードで閉じるべきところを閉じればよいっぽい
- perlの方のコードいじって toolshed に入れときます
池田
NGS現場の会のハンズオンの質問の時点で要望が有ったcsvをキーコラムの情報でつなげるツールの作成toolshedに放り込み予定
file1.csv
1 10 100 a
3 30 300 b
file2.csv
1 10 100 a
2 20 200 b
Column1をキーとしてファイルをjoinした結果
1 10.0 100.0 a 10.0 100.0 a
2 NaN NaN NaN 20.0 200.0 b
3 30.0 300.0 b NaN NaN NaN
インターフェイスのxml実装は未だ…面倒だな…
pitagora docker 作成の予備調査
- 目標: 小さなBase imageの作成 Pitagora-Galaxy 0.3.3 を基として他のサービス及びReference Genome等をdocker compose で統合
- pitagora-galaxy-docker: Ubuntu 14.04 + Python and gcc(Dockerfile)
- Mysql:実行イメージ(docker hub)
- Apache or ngix:実行イメージ(docker hub)
- Reference Genome: Storage(実行イメージを含まない FROM stable)
https://github.com/pitagora-galaxy/pitagora-galaxy 01_install.sh に対してpull request
鈴木
- Publicly Accessible Galaxy Servers 公共Galaxyサーバー(微生物関連)
- General Purpose / Genomics Servers 一般的なゲノム解析に使用できるサーバー
- Domain Servers 特定の生物や解析に特化したサーバー
- MetaDP for disease prediction of 16S rRNA data 微生物群集データに基づく疾病リスク予測
- MISSISSIPPI for analyses of RNA, epigenetics or metagenomics studies. メタゲノム等
- Orione for NGS analysis in microbiology 微生物NGS解析
- Tool Publishing Servers 特定の組織のツールを公開するサーバー
- ARGs-OAP Fast annotation and classification of antibiotic resistance gene-like sequences from metagenomic data. メタゲノムの抗生物質耐性遺伝子
- BioMaS for Taxonomic studies of environmental microbial communities 環境微生物群集の分類
- BISTRO for Taxonomic studies of environmental microbial communities 環境微生物群集の分類
- BitLAB (2016) Detailed analysis of metagenomes メタゲノム
- Huttenhower Lab metagenomic and functional genomic analyses: MetaPhlAn, GraPhlAn, PICRUSt メタゲノム
- MBAC Metabiome Portal analysis of microbiome, metabolome, and immunome data (the Metabiome). 微生物群集など
- ODoSE (Ortholog Direction of Selection Engine) for genome-wide calculation of adaptive divergence in prokaryotes. 原核生物の適応放散、中立性のテスト McDonald Kreitman (MK)
- USMI Galaxy Demonstrator (2017) a collection of tools to integrate microorganisms information. 微生物の情報を統合 XML-based Microbiological Common Language (MCL)
- VirAmp (2015) viral genome assembly pipeline ウイルスゲノムアセンブリ
- VarCap (2017) Variant profiling of evolving prokaryotic populations. 原核生物の変異(SNP, InDel, 構造多型)予測
- Public ToolSheds
- プラスミドの解析 Plasmid Profiler
那須野
- NII学術情報基盤オープンフォーラム2017向けのスライド作成に専念。
- 明日午後の「クラウドトラック」セッションでGalaxyに関する話をします。
- 国内コミュニティとしてのPitagora Galaxyについても言及する予定。
- Webサイトトップページの一部イメージを引用させてもらいました。
小寺
- Galaxy をつかって結局何をしたいかというと、(1) 天然物の(未知)代謝経路を予測して (2) そこに de novo RNA-seq のデータを乗せる ということで、(2) の部分は末竹くんにお願いしてるので (1) の部分の整備をしてました。
石井
- pdb-cloneによる Galaxy デバッグの方法を学んだ
- Docker Galaxy で workflow がインポートできないとおもっていたが、実際は、エラーページを表示しようとしたときに、docker内の nginx で、エラーがでているようだ。足りないツールをインストールする部分は今度作りたい
末竹
- 自身の卒論で使いたいワークフロー 『RNA-seq から二次代謝に関わってそうなタンパク質ドメインの発現量を算出する』 の構築を引き続き行った。
- ワークフローに必要なツール群の把握は大体できた。
- それらのツール群の Docker Container は用意できた。
- ツールの Docker Container を Tool Shed に登録する。
- ひとまず Bridger の ラッパーを書いて自身の仮想マシン上で動かすとこまでやった。
- Tool Shed に登録しようとしたところ、既に出来の良さそうなものがあったから、それを使えば良いんじゃないってなっている。
- 今後は自身の仮想マシン上でワークフローを完成させ、Document を書き、Pitagola の方に登録してもらうところまで持っていく。