PFP Descriptors
~~~計算できなかった特性へ、機械学習で挑む~~~
汎用機械学習ポテンシャル (uMLIP) であるPFPは、様々な物質の特性を計算することができます。しかしながら、PFPをもってしても時間スケールや空間スケールの観点から計算が難しい特性があります。PFP Descriptorsは、それらの特性予測に対する新しい選択肢です。
PFPに用いられているグラフニューラルネットワークには、各原子に周辺の局所環境を表現するためのベクトルが割り当てられています。それを取り出したものがPFP Descriptorsです。1原子あたり256次元の配列として参照できます。PFP Descriptorsはエネルギーや力を予測するために学習された表現ですが、原子間の相互作用に関する情報が潜在的に取り込まれており、機械学習の記述子として活用が期待できます。
例えばMLIPは、量子化学計算における電子状態計算のプロセスを省略することで、高速なエネルギー計算を実現しています。そのため、MLIPを用いたシミュレーションでは電子状態に依存する物性を直接計算することは原理的に困難でした。これに対しPFP Descriptorsは、エネルギーや力を学習する過程で原子の化学的環境に関する情報を獲得していると考えられます。これを機械学習と併せて用いることで、これまでMLIPでは難しかった電子状態に関わる特性についても、高精度な予測が可能になると期待されます。
※本機能は試験提供中のサービスであり、予告なく提供条件変更、互換性のない変更、サービス停止させていただく可能性があります。

PFP Descriptorsでできること・メリット
- 局所環境を反映した原子特徴量の生成
- 原子や材料特性の高精度予測
- 原子や材料の状態変化の分析
活用事例
原子単位での活用
NMR Chemical shift予測
PFP Descriptorsは、原子一つひとつの局所環境をベクトルとして表現します。NMRのChemical shiftはその原子の局所環境に強く依存することから、局所環境を精緻に表現可能なPFP Descriptorsを機械学習に用いることで、NMRのChemical shiftを高精度で予測できることを確認しました。
(参考:GitHub)
材料単位での活用
物性予測
PFP Descriptorsは、材料全体の特性予測にも有効です。公開ベンチマーク (Matbench) に含まれる多様な特性に対して、高い予測精度を達成しています。PFPは、膨大な材料データを事前学習しており、その中間層には材料に関する豊富な情報が蓄積されています。この中間層から抽出したPFP Descriptorsを機械学習モデルの構築に利用することで、高精度な予測モデルを構築できたと考えられます。
(参考:The Power of PFP Descriptors)
Trajectoryの次元削減
材料の構造最適化や分子動力学シミュレーションの過程で、材料は様々な構造に変化します。これらの構造変化を把握することは重要ですが、従来の手法では、可視化のために人が結合長や結合角といった物理量を定義する必要がありました。そこで、PFP Descriptorsを用いることで、シミュレーションの各時点における構造をベクトル化し、次元削減することが可能になります。これにより、構造同士の類似性を容易に把握できます。
下の図は、L-アラニル-L-アラニンの構造最適化計算におけるTrajectoryを、PFP Descriptorsを用いて次元削減した結果です。図を見ると、ポテンシャルエネルギーが近い構造はプロット上で互いに近くに配置されており、構造の類似性に基づいて適切に可視化できていることが分かります。

このほかにも、PFP Descriptorsは機械学習モデルの解釈など様々な用途に応用可能です。ご興味のある方は、お気軽にお問い合わせください。