Pitagora Meetup 2020-02
概要
- 日時: 2020年02月27日(木)10:00 〜 19:00
- 場所: フルリモート, オンライン参加のURLは決定次第告知します
- 連絡先: 大田 t.ohta [at] dbcls.rois.ac.jp
- Skype ID:pitagora-network (最新バージョンのSkypeの使用を推奨)
タイムテーブル
途中参加、途中退出は自由です。*印が付いている時間がオンラインでの集合目安時間です。その後は繋いだままでもいいですし、一度切って作業に集中しても構いません。
Time |
|
10:00-10:15 |
今日の作業確認* |
10:15-13:00 |
開発とディスカッション |
13:00-14:00 |
ランチ* |
14:00-17:00 |
開発とディスカッション |
17:00-17:30 |
ラップアップ* |
19:00- |
有識者会議* |
ミートアップの主旨
- データ解析ツール・ワークフローを共有する
- ソフトウェアをコンテナ化する
- Galaxy や CWL などを使ってツール定義、ワークフロー定義を書く
- ドキュメントを書いて GitHub で公開する
- 共有されたツールやワークフローを実行する
- うまくいったこと、うまくいかなかったことを記録する
- 技術情報を共有する
- 関連OSSプロジェクトにコミットする
- SNSで質問する
- hashtag をつけて twitter で
- プロジェクトの Gitter channel があればそこで聞く
- Issueを立てる
- Pull Request を送る
- その他データ解析に関わる人々の日々の暮らしが豊かになる開発を進める
まとめ
大田
- ピタゴラ初のフルリモートミートアップ (nomeetup/virtual meetup)
- Zoomが大変よろしい
- 無料アカウントがホストだと3人以上の通話は40分で切られるらしいが今日は再現できず
- WebExのアカウントがDBCLSにあるらしいので今度試してみてもいいかも
- 以前参加してくださったコネチカットの正村さんとZoomの脇でSkypeミーティング、解析の相談をした
- 腸内細菌叢の比較解析、どのようにサンプルをグループ分けするか
- 理研の某DBの設計をやったりパーサーを書いたりしている
- 閉鎖系のシステムはデータの中身の問い合わせをしたりなかなかスムーズにいかないですね
- usegalaxy.org/usegalaxy.eu を久々に見たら確かにツールがめちゃ増えていた
- オンプレ環境の優位性が相対的に下がっていそう
- ナベさんにお願いするのが現状のGalaxyベストプラクティス感ある
- ToDo: CWL-metrics のコードベースの整理とリリース
丹生
- 自作ワークフローエンジンep3の次期バックエンドとして利用する予定の状態遷移システムの開発
- 遷移システムに文字列型の導入
- 整数値と文字列の値でイベントを dispatch できるようになったので、そろそろ CommandLineTool は動くのでは
- バックエンドはD言語製
- D言語の標準ライブラリと戦っていた
- D言語には未定義動作を起こすコードをコンパイルエラーにしてくれる
@safe
という素敵機能がある
- また、D言語の変数はデフォルトでスレッドローカルで、複数スレッド間で共有する変数には
shared
を付けることで型チェックの恩恵に預かれる (キャストで無理やり外すと @safe
でなくなる)
- Cと同じスレッドグローバルな変数も定義できる(
__global
)が、当然 unsafe
- 自作した関数に
@safe
をつけようとすると、標準ライブラリの関数である std.concurrency.spawn
などが @safe
で動かない!
- 中で
__global
を使ってる…
- 大元の原因を解決するためのPRを送って格闘中
- 先は長いが、マージされても開発中のシステムの機能が増えるわけではない(つらい)
- 脱線しつつある
- 3rd party の YAML パーサーライブラリが
pure
で動かない
pure
: グローバル変数やファイル入出力などを行わない
- 潜っていくと標準ライブラリの
std.variant
にぶち当たる
- やはり脱線しつつある
- Galaxy ベースの再構成システムの論文を書いていた
那須野
- cwl-metrics で生成されるワークフローのメトリクスデータと同じ形式の出力が得られる Galaxy Log Generator を使った Galaxy ワークフローの動作確認をやっていた。(Galaxy ベースの再構成システム)
- HISAT2→Cufflinks,StringTie ⇒ OK
- STAR→Cufflinks,StringTie ⇒ NG (再構成ステップを組み込んだ部分が不完全だったのでデバッグ中)
- その他、お仕事のオンラインミーティングで途中抜けました。
末竹
- 途中日本橋で理研のユニットミーティングに行った
- 理研の某DBの実装を進めた
- Vue.js でダラダラと書いている
- Elasticsearch と組み合わせると実質 backend が要らなくなるから楽
- 大学がアレなため毎日アスケイドにいるが、常に食べるものがあって良い
- これ良い
- https://www.amazon.co.jp/gp/product/B07YFPDNMY
- 純正の 3/4 くらいのサイズで、1port の時は 60W で 2port の時は 18W and 45W になるからちょうどよい
- 那) 私はこれ→ https://www.amazon.co.jp/gp/product/B07TXYZ4GZ
山中
- 今後のリモート Meetup を見据えて Zoom を検証した
松尾
- 先週やっていた現職最後の業務の振り返りをしていた
- 遺伝研スパコンに、自作の簡単なワークフローのSingularityイメージをのっけた
- 作成手順等の引継ぎドキュメントを作ったので、それを見直していた
- 確かwigToBigWigとか、メモリ食う処理だけちょっとコケそうなので、警告を書いたり。
- 来週から日本IBMに転職します。クラウド中心に顧客案件をやる部門です。
志波
- ローカルのGalaxy環境に新規に追加したいツールを探すために、usegalaxy.org のツールメニューを眺めていた。
池田
- zoomが結構使える事を確認した
- Quantseq(3’ RNA-seq)のtrimmingの効果を確認
- https://www.lexogen.com/wp-content/uploads/2018/10/015UG108V0201-QuantSeq-Data-Analysis-Pipeline.pdf
- ATコンテントが高い理由は良くわからない
鈴木