※この記事はYASARA Structure Version.25.9.17 を使用して作成しています。
YASARAのVersion.25.9.17のアップデートに伴い、最上位グレードであるYASARA StructureにBoltz-2 の構造予測プログラムが含まれました。
これにより、プロテインモデリングの実行時、テンプレート構造にBoltz-2による予測構造を利用することができるようになりました。
また、新しく「FoldObj」コマンドが追加され、Boltz-2による複合体の構造予測を行うこともできるようになりました。
この記事では、Boltz-2に関連する新機能について紹介します。
Boltz-2とは?
Boltz-2は、2025年6月に発表された構造予測と結合親和性予測を統合した生体分子基盤モデルで、AlphaFold3に匹敵する精度を持つオープンソースモデルBoltz-1をベースに、MIT Jameel ClinicのBoltzチームとRecursionによって開発されました。
構造予測に加え、長時間かつ高コストな自由エネルギー摂動(FEP)計算に匹敵する精度の結合親和性予測を、1000倍以上速い計算速度で行える点が大きな特徴です。
YASARAでは、Boltz-2の構造予測機能を利用して、プロテインモデリングのテンプレート構造に利用したり、タンパク質やDNA/RNA、小分子リガンドの複合体構造予測をしたりすることができます。
※ブログ執筆時点(2025/10/06)では、Boltz-2の結合親和性予測機能は含まれていません。
YASARAでの利用 ①プロテインモデリング
YASARAに Boltz-2 の構造予測プログラムが含まれたことにより、プロテインモデリング実行時に、Boltz-2による予測構造をテンプレートとして利用できるようになりました。
さらに、Boltz-2の構造予測に加えて UniRef90 または AlphaFold データベースを用いた MSA(多重配列アライメント) を組み合わせたオプションも利用でき、より高精度なモデリングが可能になっています。
これまでYASARAでは、AlphaFold(データベース利用のみ)、ESMFold、OmegaFoldといったAIベースのフォールディング手法を利用できましたが、今回のアップデートにより、pm_build.mcr マクロや Experiment Protein Modeling 実行時に以下の新しいオプションが追加されました:
- Boltz:Boltzにより作成した予測構造をテンプレートに利用
- BoltzMSA90:Boltzによる構造予測にUniRef90 データベースを用いたMSAを加え、予測構造をテンプレートに利用
- BoltzMSAAF:Boltzによる構造予測にAlphaFold データベースを用いたMSAを加え、予測構造をテンプレートに利用
Boltz-2は複合体の構造予測が可能なので、利用できるAIベースのフォールディング手法のオプションの中で唯一、オリゴマーの構造予測に対応しています。
pm_build.mcr マクロでの利用方法
AIベースのフォールディング手法を用いたタンパクモデリングを実行できる 「pm_build.mcr」マクロ では、パラメータセクション内の 「foldmethod」パラメータ で、テンプレート構造に利用するAI手法を指定できます。
デフォルトでは、
foldmethod='ESMFold+OmegaFold+BoltzMSA90'
となっていて、「BoltzMSA90」(Boltzの構造予測+UniRef90データベースに対するMSA)が指定されているので、デフォルトの「pm_build.mcr」マクロを実行するだけでBoltz-2の構造予測機能を利用することができます。
マクロの実行手順はこれまでと変わりないのでここでは説明しませんが、知りたい方はYASARAユーザーマニュアル(Help > Show user manual)の「Recipes-Perform complex tasks > Build a protein model > Protein modeling the easy way」の項目を参考に実行して下さい。
Experiment Protein Modelingでの利用方法
プロテインモデリングは、前述のマクロを実行する方法の他に、メニューから
「Options > Choose experiment > Protein modeling」
を選択して実行することもできます。
処理の流れや結果レポートの内容はマクロ実行時とほぼ同じですが、メニューから実行する場合は、パラメータをダイアログ画面で設定できるので便利です。
YASARA Version.25.9.17へのアップデートでAIフォールディング手法にBoltz-2が追加されたことで、パラメータ設定用のダイアログ画面も少し変わりました。
以前は以下のパラメータ設定ダイアログ画面の下部にAIフォールディング手法のチェックボックスがありましたが、それが無くなり、代わりに「Min oligomerization」と「Max oligomerization」のオプションが追加されています。
このオプションは今回のアップデートに伴って追加されたもので、オリゴマー化状態の最小値と最大値を設定することができます。
※「pm_build.mcr」マクロの場合は、マクロ冒頭のパラメータセクション内にある「OligoStateMin」と「OligoStateMax」の設定値を変更することで同様の指定ができます(こちらも今回のアップデートで追加されました)。
次のダイアログ画面が追加され、ここから利用するAIフォールディング手法を指定します。
デフォルトでは、①Boltzの構造予測+UniRef90データベースに対するMSAあり、②ESMFoldの構造予測、③OmegaFoldの構造予測、の3つのオプションが有効になっています(「pm_build.mcr」マクロ実行時のデフォルト設定と同じです)。
YASARAでの利用 ②複合体構造予測
次に、Version.25.9.17で新しく追加された複合体構造予測コマンド「FoldObj」の機能と実行方法を紹介します。
「FoldObj」は Boltz-2 を利用して、タンパク質・核酸・リガンドからなる複合体の立体構造を予測できるコマンドです。
事前準備
まず実行前に、以下を準備しておく必要があります。
アミノ酸または核酸の配列
構造予測に使用する入力配列を、次のいずれかの形式で用意します。
- PDBファイル(SEQRESレコードの配列が利用されます)
- FASTAファイル
- 直接入力(コンソールからコマンドを入力して実行する場合のみ)
※注意点
- アミノ酸配列は大文字、核酸配列は小文字で記述してください。
- 二本鎖核酸をモデル化するには、両方の相補鎖の配列を記述してください。
- 直接入力する場合は、個々の配列を「|」で区切って下さい。
リガンド構造(予測構造に含める場合)
構造予測に低分子リガンドを含めたい場合は、事前にYASARAの操作画面にリガンドをオブジェクトとして、作成・表示しておいてください。
(実行時に、リガンドをSceneのリストからオブジェクト単位で指定するため)
オブジェクト内の分子の1つとして含まれている場合などは、「Split」コマンドを利用するなどしてリガンドを単一のオブジェクトにしておいてください。
実行方法
次のいずれかの操作で実行します。
- メニューから「Edit > Build > Object and fold with AI」を選択して実行
- コンソールから「FoldObj」コマンドを実行
この記事では、メニューから実行する場合の実行例を紹介します。コンソールからのコマンドの実行方法については、ユーザーマニュアルの「FoldObj」コマンドページをご参照下さい。
実行例1:HIVプロテアーゼ+リトナビル の構造予測
「FoldObj」コマンドを利用して、HIVプロテアーゼと阻害薬のリトナビル(タンパク質+低分子)の複合体構造予測を行ってみたいと思います。
事前準備
HIVプロテアーゼのアミノ酸配列(PDBファイル)
今回は、HIVプロテアーゼの配列をPDBファイルで用意してみます。
YASARAを起動し、「File > Load > PDB file from Internet」から、PDB ID「1HXW」(HIVプロテアーゼとリトナビルの共結晶構造)をダウンロードして読み込みます。
この構造には不要な分子は水分子しか含まれていないため前処理は行いませんが、必要に応じて不要な分子を削除してください。
構造予測ではPDBファイルのSEQRESレコードの配列を利用するため、リガンドや水分子などは含まれていても問題ありません。
構造を「File > Save as > PDB file」からPDB形式で保存します。
※RCSBのサイトからPDB IDを検索し、「Download Files」のプルダウンからFASTAファイルやPDBファイルをダウンロードして構造予測に利用してもよいと思います。
リガンド構造の準備
今回は、先ほど読み込んだHIVプロテアーゼとリトナビルの共結晶構造から準備していきます。
リガンドをオブジェクトとして用意する必要があるので、「Split」コマンドを利用してタンパク質とリガンドにオブジェクトを分割します。
上の図のように、タンパク質(HIVプロテアーゼ)とリガンド(リトナビル)をオブジェクト分割し、オブジェクト名も変更しました。
※オブジェクト名は変更しなくてもよいですが、わかりやすくするために変えています。
リガンドのオブジェクトを操作画面に用意できたら、準備は完了です。
(画面に他のオブジェクトが存在しても問題ないです。)
「FoldObj」の実行
それでは、実際に「FoldObj」を実行してみます。
メニューから、「Edit > Build > Object and fold with AI」をクリックします。
- Browseから先ほど用意したPDBファイル(またはFASTAファイル)を選択します。
- 以下の3つから利用するオプションを選択します。
・Boltzを使用した構造予測(MSAを利用しない)
・Boltzによる構造予測に、UniRef90データベースを用いたMSAを加える(デフォルト)
・Boltzによる構造予測に、AlphaFoldデータベースを用いたMSAを加える
今回は、デフォルトの「Boltz with MSA 90」で実行してみます。MSAを利用すると、精度が向上しますが処理に時間がかかります。 - 構造予測にリガンドを含めたい場合は「Select ligands」、リガンドを含めずに実行する場合は「Start prediction」をクリックします。
今回はリガンドを含めたいので、「Select ligands」を選択します。すると、リガンドオブジェクトの選択ダイアログが表示されるので、該当するオブジェクトを選択し「OK」をクリックします。
結果の確認
処理が終了すると、操作画面に作成された構造が表示されます。
次に、入力ファイルにFASATAファイルを利用して、ロイシンジッパーとDNA鎖の複合体を作成してみます。
事前準備
FASTAファイルの準備
今回は、YASARAのユーザーマニュアル、「FoldObj」コマンドページのコマンド例(Example 5: )に記載されている配列を利用します。
sample.fasta
>protein_seq1 MKDPAALKRARNTEAARRSRARKLQRMKQLEDKVEELLSKNYHLENEVARLKKLVGER >protein_seq2 MKDPAALKRARNTEAARRSRARKLQRMKQLEDKVEELLSKNYHLENEVARLKKLVGER >dna_seq1 tcctatgactcatccagtt >dna_seq2 aactggatgagtcatagga
※このサンプルではそれぞれの配列を分けて記載していますが、コマンド例のように各配列をパイプ「|」でつなげて記載することもできます。
※配列情報が記載されたFASTAファイルは、RCSBのサイトから目的のPDB 構造を検索し、「Download Files」のプルダウンから入手することもできますが、YASARAの構造予測に使用する場合は、前に記載した注意点を参考に適宜編集してください。
「FoldObj」の実行
それでは、メニューから「Edit > Build > Object and fold with AI」をクリックして構造予測(「FoldObj」コマンド)を実行してみます。
今回はリガンドオブジェクトを含めずに実行するので、表示されるダイアログ画面の「Brows」から用意したFASTAファイルを指定後、「Start prediction」をクリックして実行します。
ロイシンジッパーとDNAの複合体構造を作成することができました。
実行例1と同様、生成された構造は自動保存されないので、File > Save as メニューから構造ファイルを保存してください。
まとめ
Version.25.9.17のアップデートで、Boltz-2の構造予測プログラムがYASARAに含まれたことで、オリゴマーや、タンパク質・DNA/RNA・小分子リガンドを含む複合体全体の構造予測を行うことができるようになりました。
モデリングにお役立ていただけると思いますので、ぜひ新しい機能を試してみて下さい。