PFPの予測性能検証
MLIPを含む機械学習モデルは一般に、学習に使用していないデータを用い、どのくらいの精度で予測できるか検証を行います。ここでは、PFPに対して行った性能検証を紹介します。エネルギーや力の予測検証の他、材料特性に関する検証を行っています。
PFPのエネルギーと力の予測性能検証
PFPはuniversalなMLIPを目指し、自然界に存在する全ての元素を網羅する96元素対象に、膨大な組み合わせを学習させてきました。教師データとなる学習データセットには、図1に示すように分子や結晶だけでなく、スラブやクラスター、不規則な構造、吸着構造など様々な構造とそのエネルギーを含んでいます。

PFPの現実世界に存在する多様な物質に対する再現性を確認するため、Crystallography Open Database (COD)を利用して再現性の検証を行いました。なお、ここで用いるCOD構造を用いたベンチマークデータセットはPFPの学習には利用していません。エネルギーと力に関しての結果を図2に示します。プロットの色はデータの密度を表しています。赤い部分には多くのデータがあり、青い部分にはデータが少ないことを表しています。エネルギーと力は、構造最適化を行い、微小変位を加えた構造に対して計算を行っています。また、エネルギーに関しては、1原子あたり、力に関しては、各原子にかかる力のxyz成分をそれぞれ独立な点としてプロットしています。有機結晶、錯体結晶、無機結晶など様々な固体に対して、PFPはエネルギーと力、その両方について、高い精度でDFTの結果を再現できていることが確認できています。

PFPによる材料特性の再現検証
物質の密度、相図は原子同士の相互作用の影響を強く受けて決まります。そのため、これらの特性が再現できれば、原子同士の相互作用を考慮した振舞いを再現できていることになります。ここでは、有機化合物の液体の密度と無機結晶の相図について検証を行った結果について紹介します。
液体の密度についての検証
実験でよく用いられる有機化合物25種の密度の実験値と、PFPを用いて計算した値について比較した結果を図3に示します。点が対角線に近いほど、精度高く再現できていることを表しています。ほとんどの有機化合物の密度を高い精度で再現できていることがわかります。

相図についての検証
次に、無機結晶の相図についての検証結果について紹介します。無機結晶の相図は、元素の組成と形成エネルギーの空間に様々な結晶構造を配置した図です。ここでは相図の再現性の指標として、相図を描いたときの安定構造以外の結晶構造のエネルギー (energy above hull) の予測精度に着目しました。これは、相図における凸包が正しく描けていることに加え、類似の組成を持つ結晶構造間のエネルギーの差が正しく表現できているかどうかを測る指標になります。得られた結果を以下に示します。データが対角線上に集中していることから、高い精度で再現できていることがわかります。
