YASARA Tipsのネタがなくなったわけでは全くないのですが,今回は,オープンソースで無償利用可能なDataWarriorのTipsを一つ.
DataWarriorは,数万化合物を収録したSDFファイルを軽快に可視化,解析できるので便利なツールです.LigandScoutも最近のマイナーリリースで,DataWarrior のファイル形式,「.dwar」をサポートしました.
DataWarrior
An Open-Source Program for Data Visualization and Analysis with Chemical Intelligence
http://www.openmolecules.org/datawarrior/
物性値や記述子等を用いた2D,3Dプロットは,直観的にすぐわかるのですが,1Dデータを用いる度数分布図は,少しだけ追加の手続きが必要です.
- 最初に,数値データフィールドを持つSDF等を読み込みます.
- Dataメニューから Add Bins From Numbers...をクリックし,ダイアログを表示します
- ダイアログのリストから,ヒストグラムのbins作成に用いる数値データを選択します
- 同ダイアログで,Bin sizeとFirst Bin Fromを入力し,OKボタンをクリックします
以上の操作でTableに”Binned (数値ラベル)”列が追加されます.
ヒストグラムを描画するには,続けて,
- 2D Viewのxデータに”Binned~”を,yデータに”<unassined>”を指定
- 2D Viewのプロットエリアで右クリック,コンテクストメニューからSet Preferred Chart Type...を選択
- 表示されるダイアログでPreffered Chart TypeにBar Chartを選択し,OKボタンをクリック
とします.度数を横軸方向とする場合は,xとyデータを逆にします.
次の動画は,50,000化合物のSDFファイルを対象としたヒストグラム描画の実施例です.
以上,自分自身の備忘録をかねて,DataWarriorのTipsでした.
Reference:
http://www.openmolecules.org/help/analysis.html