主旨
- ツールやワークフローを持ち寄って仮想マシンに加える (図)
- 実際には、加えるための手順を作って、仮想マシンの管理者と共有する
- 同時に、Wiki に新しいツールやワークフローの説明を記載する
- プロジェクトを改善するためのフィードバックを収集する
- 解析プラットフォーム管理に役立つ技術ネタを共有する
- Galaxy 以外のソフトウェアを扱っていく可能性について議論する
スケジュール
- 日時: 2015年10月22日(木)
- 場所: 国立情報学研究所(神保町)19F 1901
- Skype ID:pitagora-network(最新バージョンのSkypeの使用を推奨)
|
|
10:00-10:15 |
主旨のリマインド + 今日の作業確認 |
10:15-18:00 |
ツールの開発 |
18:00-18:30 |
今日のまとめ + 次回の日程調整 (Skype 参加可) |
18:30-20:30 |
有識者会議 |
内容
全体
山中
- 前回、この Wiki の内容が Google の検索に掛からないという話がありましたが、試したところ検索できたので、設定変更していません。
- ようやくひとつめのツール(tophat2)の Docker 版を作成!今後はどんどんコンテナ化だ!
- 作成方法を ツールのコンテナ化 に記載
- コンテナ作成方法は未記載(大田さんにお願いする予定)
大田
- 分生の発表について内容をかためる
- ツールのコンテナ化にトライ
- bcl2fastqは入力がディレクトリ
- 入力にディレクトリなんてできるの?
- トリッキーなことをしないとできない
- UIで解決すべき問題かもしれない
- zip, tgzなどは展開されて .dat ファイルとして保存される
- 複数ファイルを1つのアーカイブにすると最初のファイルが読み込まれる
- ディレクトリを固めるとディレクトリのlsの結果が .dat として読み込まれる
-
seq 4000 |
awk ‘BEGIN{base[0]=65;base[1]=67;base[2]=71;base[3]=84;}NR%4==1{print “@read.” int(NR/4)+1}NR%4==2{seq=““;for(i=1;i<37;i++){seq=seq sprintf(”%c”, base[int(rand()*100%4)])};print seq}NR%4==3{print “+”}NR%4==0{qual=““;for(i=1;i<37;i++){qual=qual sprintf(”%c”, substr(rand(), 3) % 93 + 33)};print qual}’ |
小寺
- すみません、今回もちょうどその日に出張が入ってしまって参加できません。なかなか進めなくてもどかしく思っていますが、ちょっとだけ質問すれば解決して先に進めるということも多いと思いますので、別の日にお会いするか、Skypeで相談に乗っていただくか、できませんでしょうか? > はい、来週 Skype でミーティングさせてください!(山中)
- 2015/10/26 山中さん、ありがとうございました。
那須野
- Pitagora-Galaxy VM のローカルホスト上のDockerで、コンテナ形式のツールが動かない問題のデバッグ作業を実施。
- ジョブ実行スクリプト内で docker コマンドを sudo で実行する場合、OSデフォルト設定ではtty経由以外のsudoを禁止していたため。
- 現状の LocalJobRunner ではジョブスクリプトの標準エラー出力はどこに出るんでしょう?(これが見えれば一瞬で解決できたのですが。。。)
鈴木
- “Bioinformatics Data Skills” (O’Reilly) のメモ
- 微生物NGS解析用ツール
- ウイルス解析用ツール
- Publicly Accessible Galaxy Servers には、ウイルス・ゲノムのアセンブリ用パイプラインVirAmpは有るが、アノテーション用パイプラインは無い。
- viralcloudをインストールした。山中さんにアドバイスを頂き、Tool shed を使ったツールのインストール を参考にして、[Install to Galaxy]を実行。
- ブラウザ Safari では失敗。エラーメッセージは“Repository installation is not possible due to an invalid Galaxy URL: None. You may need to enable third-party cookies in your browser.”
- ブラウザ Chrome/Firefox では成功。“Error Traceback: ⇝ URLError: <urlopen error [Errno -3] Temporary failure in name resolution>”というエラーメッセージにより、別のWifiを使った。
- このエラーは VirtualBox 4 系と NII の Wifi ネットワーク環境の相性の問題のようです。推奨を 5 にするか検討します。(山中)
池田
- Variant Call 04 ワークフローの開発
- Variant call from RNA-seq with GATK and STAR(https://github.com/alexdobin/STAR)
RNA-seqで取得したリードを用いてVariant Call を実行するための ワークフロー Variant Call 04の開発に着手。 本システムは比較的大きなサイズのメモリ(〜30GB)を必要とするためNiiの基盤システムを利用して稼働環境を整備をすすめる。
新海
- lastのパイプラインが動作するか確認
- テストデータでは主要部分(lastal→maf-convert-sam-to-bam)が動作するのを確認。実データだとメモリサイズの関係からローカルだと厳しい。(メモリ32Gのマシン上の仮想環境で落ちる)
- samtools sortでは調達版時のツールではうまくいかない。原因不明。tool-shedのツールで処理が可能なのを確認。
- tool-shed化については、今後のピタゴラギャラクシーがdockerに移行する可能性があるため、そこの部分の方針が定まってから実作業の予定。
- gatkツールのtool-shed化作業関連
- 既に大体のツールはtool-shed化済みなので、パイプライン(gatkリキャリブレーション)に必要なものを補っていく方向で。
- その他詳細は Admin_Variant_Calling_01 にて