主旨
- ツールやワークフローを持ち寄って仮想マシンに加える (図)
- 実際には、加えるための手順を作って、仮想マシンの管理者と共有する
- 同時に、Wikiに新しいツールやワークフローの説明を記載する
- プロジェクトを改善するためのフィードバックを収集する
- 解析プラットフォーム管理に役立つ技術ネタを共有する
- Galaxy以外のソフトウェアを扱っていく可能性について議論する
スケジュール
- 日時: 2015年07月23日(木)
- 場所: 国立情報学研究所(神保町)20F 2006
- Skype ID:pitagora-network(最新バージョンのSkypeの使用を推奨)
|
|
10:00-10:15 |
主旨のリマインド + 今日の作業確認 |
10:15-10:30 |
コミュニティ仮想マシンの更新報告 |
10:30-18:00 |
ピタゴラ装置の開発 |
18:00-18:30 |
今日のまとめ + 次回の日程調整 (Skype 参加可) |
18:30-20:30 |
有識者会議 |
内容
山中
- 仮想マシン Version 0.2.4 作成 (ツール・インストールスクリプトについて那須野さんに相談)
- できなかったので、次回 Meetup 2015-08 までに完了させて報告致します。(運用として、仮想マシン作成は Meetup とは別の時間枠でやるべき)
- 有識者会議にてご相談1:Galaxy のマニュアル作成(Wiki よりも初心者向けな感じのもの)
- 有識者会議にてご相談2:論文作成(どんなテーマで?どこに投稿?)ーー 論文投稿が必要か? > 必要な参加者がいれば協力したい!
大田
- Galaxy Community Conference 振り返り
- 花見ワークフロー
- 環境メタゲノムなどで使われる メタ 16S シーケンスのワークフロー
- シーケンサから出るRunフォルダ -> bcl2fastq -> demultiplex ->rdpclassifier
- bcl2fastq はtoolshedになさそう
- Dockerfile は既にある
長崎
10kbくらいのヒト6番染色体由来のゲノム配列、tab区切りでcdsの位置情報が書かれた データファイル、toolShedなどに置くときはどうするの?というような相談をさせていただいた。 あまり細かい取り決めなどないようなので結局フォルダ1こにまとめてパス通るようにしとけば、 ということで解決。
那須野
- NIIクラウド上のGalaxyでRNA-seq01ワークフローを流す
- まずはtophat2, bowtie2, cufflinksをコンテナ化すればよいはず。(テストデータはPitagora Wikiにあるものを使えばOK?)
- VPCモニタリング機能(パイプライン実行履歴を収集して可視化=データベースにaurora_job表を追加)実装
- 実装および動作確認まで完了。GalaxyのORマッパー sqlalchemy を使って実装した。
新海
- VariantCallingワークフローの調達版(ラボ内環境でほぼ動作している)をピタゴラに移して作業
→作業継続中ですが、移植元がバージョンが古いせいか色々と上手くいかず戸惑い中です。次回は最新版のマニュアルとか確認してやり直したい。
鈴木
小寺
'std::bad_alloc'
If it indicates bad_alloc(), then Inchworm ran out of memory. You'll need to either reduce the size of your data set
or run Trinity on a server with more memory available.
The inchworm process failed.
- 小さいfastqファイルで試してみる(1.9G x 2 → 645Mと638M)
- Trinity JM (Jellyfish) で使うメモリは最低1Gで、設定値を上げることが可能だが、次に大きい10Gにすると「メモリを確保できません」で落ちた。
- 小さいfastqファイルで、メモリ1Gにしてもやっぱりメモリが足りないと言われ止まった。止まった原因はコマンドラインで結果ファイルを見ないと分からない。
- この辺を指定すると動くかもしれません(小澤)
- –bflyHeapSpaceMax
- –bflyGCThreads
- ありがとうございます。試してみます。
- bflyHeapSpaceMax オプション(意味はまだ分かっていない)がデフォで4Gになっていたのを1Gにして実行
- 、、、しようと思ったけど「Use Additional Params?:」をYesにすると「failure preparing job」エラーとなる事案発生
- NotFound: cannot find ‘min_kmer_cov’ while searching for ‘inputs.min_kmer_cov’
- /home/galaxy/shed_tools/toolshed.g2.bx.psu.edu/repos/biomonika/trinityrnaseq/39b85d32b0bf/trinityrnaseq/trinity.xml を編集して対処
- trinity.xml を書き換えたら sudo service galaxy restart
- 元 –min_kmer_cov $inputs.min_kmer_cov –max_reads_per_graph $inputs.max_reads_per_graph –bflyHeapSpaceMax $input.bflyHeapSpaceMax
- –min_kmer_cov 1 –max_reads_per_graph 20000000 –bflyHeapSpaceMax 1G のように決め打ちにしたら動いたっぽい。
- でも結局 inchworm で止まった。jellyfishやbutterflyでは使用メモリ量があらかじめ指定できるが、inchwormではCでallocするので使用メモリ量をあらかじめ指定できない?
- なので –min_kmer_cov を 1 から 2 に変えた。これでinchwormでのメモリ使用量を減らせると期待。
- 次回の課題
- Trinity がきちんと最後まで動くことを確認し、RSEMに連結する。
- trinity.xml のパラメーター指定の部分のエラーが未解決。決め打ちではなく選択可能な形で動くようにしたい。
池田
- Pitagora galaxy のServerへの展開
- Galaxyのインストール手順の確認
- 仮想環境: VmWare Fusion 7.1.2
- Client OS: Cent OS 7.0 (CentOS-7-x86_64-Minimal-1503-01.iso)
- インストール手順書からの変更点
- mysqlのインストール手順の変更
- サーバー起動手順の変更
小澤
- KVM上ので動作確認 ——————> こちらにアップしました Admin > KVM で起動する手順(山中)
- SLES11SP3のKVM上ではあっさり動作
- RHEL6.6のKVM上では起動できず
- ファイルのconvertからインストールまでをスクリプトで自動で