Pitagora Meetup 2021-12
概要
- 日時: 2021年12月9日(木) 11:00 〜 18:00
- 場所: ハイブリッド
- オンサイト会場: 貸し会議室 (東京都板橋区前野町3-41-1)
- 人数制限があるため、オフライン参加を希望する方は Slack にてご連絡ください
- 対面参加をされる方は SARS-CoV-2 ワクチン接種を完了させる (2回目接種から2週間経過) ことを強く推奨します。
- COVID19 感染対策にご協力ください。
- オンライン参加 (Pragli) のURLは Pitagora Slack で告知します
- Slack にはどなたでも参加できます。こちらからどうぞ。
- 不明なことがあれば遠慮なくこちらへどうぞ: 大田
t.ohta [at] dbcls.rois.ac.jp
タイムテーブル
途中参加、途中退出は自由です。
Time |
|
11:00-11:15 |
今日の作業確認* |
11:15-13:00 |
開発とディスカッション |
13:00-14:00 |
ランチ* |
14:00-17:30 |
開発とディスカッション |
17:30-18:00 |
ラップアップ* |
19:00- |
有識者会議* |
ミートアップの主旨
- データ解析ツール・ワークフローを共有する
- ソフトウェアをコンテナ化する
- Galaxy や CWL などを使ってツール定義、ワークフロー定義を書く
- ドキュメントを書いて GitHub で公開する
- 共有されたツールやワークフローを実行する
- うまくいったこと、うまくいかなかったことを記録する
- 技術情報を共有する
- 関連OSSプロジェクトにコミットする
- SNSで質問する
- プロジェクトの Gitter channel があればそこで聞く
- Issueを立てる
- Pull Request を送る
- その他データ解析に関わる人々の日々の暮らしが豊かになる開発を進める
まとめ
池田
- 開始時間前に貸し会議室に到着して手続き
- Javascriptのお仕事中
- CodeMirror.js の利用スクリプトの書き直し
- tabulatorのカスタマイズ
- sassコマンドによりscssの変更内容をcssに反映
大田
- 来年のミートアップのスケジュールを決める
- slackでpollしてますので投票よろしくおねがいします
- ピタゴラ金策
- これまでのノウハウを集約して書籍を出版して原稿料で運営すればいいのでは説
- ANCOM-BC docker container 作り(難航している)
- https://github.com/mortonjt/q2-ancombc
- pluginの実装が中途半端なので動かないので厳しい
- Sapporo 論文手直し
- TeXのままだと文章構造の書き直しがつらい
- detex というのがあるらしいと教えてもらった
- opendetex
- https://orebibou.com/ja/home/201704/20170425_001/
- インスコ面倒そうだったのでコンテナにした
- https://github.com/inutano/docker-opendetex/pkgs/container/detex
- ついでにいつも忘れるコンテナ化からpublishまでの手順をドキュメント化した
- 情報系の論文誌のためにcompileした文章を別の雑誌に出すために書き直します
新海
- ひっそりとslack参加
- ChIP-seqのデータとかいじってます
- 色々と対応していた一日でした
- ENSG00000231702とかゲノムのverで名前が違う? と皆様にご相談
- https://asia.ensembl.org/Homo_sapiens/Gene/Summary?g=ENSG00000231702;r=1:1008076-1008229;t=ENST00000423619
- https://grch37.ensembl.org/Homo_sapiens/Gene/Summary?g=ENSG00000231702;r=1:943456-943609;t=ENST00000423619
- ちゃんと理由がページに書いてある、とご指摘
丹生
山中
- MacBook を 6年ぶりに新しくしたので、というわけではありませんが
- CWL がどれくらい使われているか知りたいです!
- どこで使われているか、どうやったら調べられるでしょう?
- 丹生追記: これとかいかがでしょう!
- Google Trends
- https://github.com/search?q=extension%3A.cwl (おおた)
- ピタゴラ金策 :thinking_face:
- 何にかかるの?
- 会場(お金がかからないときもある)
- メンバーの都合で無料で使える会議室が使えない
- 今回は 1,700 * 7h = 11,900
- 懇親会?
- イベント関連?(旅費とか)
- 学生サポート(以前はそういうのもかかった)
- 回避策
- お金がかからない場所を借りる
- 区民センター的な
- アマゾン的な
- 東大本郷(アクセス悪い)
- どこから?
那須野
- 前回Meetup 以降の成果メモ
- Rootless モードでの Docker in Docker、Podman in Podman (ネスト構造でのコンテナ実行) ができた。
- Rootless Docker はデーモンやコンテナ・ランタイムのインストールから実行まで root 以外のユーザ権限で可能。
- Rootless Podman は Podman 関連パッケージのインストールのために root 権限が必要。
- Rootless D-in-D 方法
- Rootless Docker 環境で起動したコンテナ内で
dockerd --rootless
のようにデーモンを起動
- Rootless P-in-P 方法
- Rootless モードで Podman 公式イメージ
quay.io/containers/podman
を起動
- Alpine や Ubuntu コンテナイメージに podman をインストールする方法でも可能(だが若干面倒)
- root以外のユーザ
podman
がすでにあり、このユーザで Rootless モードが使える。
~podman/.config
ディレクトリがすでにあれば、onwerを podman
に変更しておく。
- 内田さんから、AWSとオンプレを併用できる分散処理基盤を構築するサービスのお話を聞いた。
末竹
- sapporo-service, sapporo-web を
1.1
にする
- 現状の GA4GH WES (Workflow Execution Service) の定義は
1.0.0
- Issue や PR は上がっているが、様々なしがらみから update されそうにない
- -> そのため、
sapporo-wes-1.0.0
という、既存の WES 定義を extend した API 定義を使っていた
- 付け加えるだけで、なるべく元の定義を使っていた (主に後々の git merge がしやすいように)
POST /runs
における workflow_engine_name
, workflow_attachment
as JSON-serialized object
GET /service-info
における executable_workflows
GET /runs/{run_id}/data
- -> もっと WES レイヤーで色々したくなってきた
- 主に
/parse-workflows
的な endpoint
- だったら、なるべく後方互換性を保ちつつも、
git merge
的な心配をすることなく API 定義書を update しようと至った
内田
- おひさしぶりなので#generalの自己紹介を書きました
- pragli(pesto)のやり方などおしえていただく
- hail-jpのためのトライアルな環境の検討
windowsにanaconda navigatorで動かしたjupyter labでいいんじゃないかと思いきやどうもそうではないようで。
forumによるとWSLが正解とのこと。。
C:\の世界ではhl.utils.get_1kg が、Wrong FSになってしまう
- hailとglowを同時に動かすきちんとした環境を追い求める
- https://hail.is/
- https://glow.readthedocs.io/en/latest/index.html (おおた追記)
八谷
- ハイブリッドミーティングの可能性について議論
- hail-jp のミーティングが2022年1月末を予定しているそうです
鈴木
-
これまでにゲノム解読されたサンプルが収集された地域(国・都市)と年月日を取得したい。
https://twitter.com/DDBJ_topics/status/1461468496403972097
-
Replicon type (Chromosome, Plasmid) の定義が曖昧。
https://www.ddbj.nig.ac.jp/bioproject/submission.html
Organism Replicons
対象となる生物が持っているレプリコンの数、その名前 (例: 1、2、3 や I、II、III)、レプリコンの種類 (chromosome など) やレプリコンが存在する細胞内構造。
-
プラスミドの taxonomy をどうするか。プラスミドの宿主細菌の taxonomy をアサインするか。あるいは(ウイルスのように)プラスミド自体の分類群をアサインするか、例えば、incompatibility (Inc) groups, Rep type, MOB typeなど。階層分類は困難。
https://www.ncbi.nlm.nih.gov/nuccore/MN908947
ORGANISM Severe acute respiratory syndrome coronavirus 2
Viruses; Riboviria; Orthornavirae; Pisuviricota; Pisoniviricetes;
Nidovirales; Cornidovirineae; Coronaviridae; Orthocoronavirinae;
Betacoronavirus; Sarbecovirus.
宿主未知のプラスミドの taxonomy ID は「unidentified (taxid: 32644)」が良い?
https://www.ddbj.nig.ac.jp/faq/ja/taxonomy-for-non-organism.html
例えば、IncP-1 Plasmids には以下の「ORGANISM」が記載されている。
https://www.ncbi.nlm.nih.gov/nuccore/U67194
DEFINITION Enterobacter aerogenes plasmid R751, complete sequence.
ORGANISM Klebsiella aerogenes
Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales;
Enterobacteriaceae; Klebsiella/Raoultella group; Klebsiella.
https://www.ncbi.nlm.nih.gov/nuccore/AJ564903
DEFINITION Uncultured bacterium IncP-1beta multiresistance plasmid pB10.
ORGANISM uncultured bacterium
Bacteria; environmental samples.
https://www.ncbi.nlm.nih.gov/nuccore/EF107516
ORGANISM uncultured bacterium pMCBF6
Bacteria; environmental samples.
https://www.ncbi.nlm.nih.gov/nuccore/AY950444
ORGANISM Plasmid pMCBF1
other sequences; plasmids.
https://www.ncbi.nlm.nih.gov/nuccore/MH392232
ORGANISM Sym plasmid
other sequences; plasmids.