AIモデル (PFP) とは

世界最先端AI技術と材料科学の知見を組み合わせて構築された独自のAIモデル、PFP (PreFerred Potential) について解説します。

世界に先駆けて開発された独自の汎用機械学習ポテンシャル PFP

原子の振る舞いを予測する高精度の手法の一つに密度汎関数理論 (Density Functional Theory: DFT) を用いた計算がありますが、これには膨大な計算コストがかかることが課題でした。この解決策として、DFTの計算結果をAIに学習させる機械学習ポテンシャル (Machine Learning Interatomic Potential: MLIP*) が研究されてきましたが、従来は特定の物質・条件に特化したモデルが主流で、様々な材料を扱える「汎用モデル」の開発は極めて困難とされてきました。
私達は、この困難な課題にディープラーニングの黎明期から取り組み、世界最高レベルの精度と汎用性を持つ独自のAIモデル「PFP」を開発しました。このPFPの基盤技術は、国際的な科学雑誌『Nature Communications』にも掲載されています。

掲載論文:Towards universal neural network potential for material discovery applicable to arbitrary combination of 45 elements (Nature Communications, 2022)

*機械学習ポテンシャルはMLIPの他、Machine Learning Potential (MLP)やNeural Network Potential (NNP)とも表現されます。日本語では機械学習力場とも表現されます。MLPとNNPは厳密にはニュアンスが異なりますが、概ね機械学習ポテンシャルを表す表現として用いられます。本サイトでは現在比較的主流となりつつあるMLIPを用います。

DFT計算相当の精度で、速度は2000万倍以上へ

PFPは、DFT計算と同等の高い予測精度を維持したまま、計算速度を最大で2000万倍以上にまで引き上げます。これまで専門家がスーパーコンピュータを使っても数ヶ月を要した大規模な計算が、数分レベルで完了します。
また、扱える原子の数も飛躍的に増大しました。最新のPFPでは最大44,000原子*の大規模な系を扱え、従来法では不可能だった複雑な界面や欠陥構造のシミュレーションを可能にします。精度・速度・規模の限界を突破し、材料開発に革新をもたらします。

*推論可能なPt(fcc)の最大原子数

自然界に存在する全ての元素で、多種多様な構造に対応

PFPは、単一のAIモデルで圧倒的な汎用性を実現しています。2024年リリースのPFP v7では96元素に対応しており、自然界に存在する全ての元素をカバー。これにより、ユーザーは元素種によるモデルの使い分けや制約を意識する必要がありません。
さらに、その適用範囲はバルク結晶に留まらず、表面・界面での触媒反応、電池材料内でのイオン拡散、有機分子の分解反応、MOF複合材料の吸着など、考えられる多種多様な原子構造・状態を区別なく、高精度にシミュレーション可能です。

アーキテクチャと学習データセット

PFPの性能は、先進的なAIアーキテクチャと大規模な学習データに支えられています。モデルの基本構造には、原子とその結合をグラフとして認識する「グラフニューラルネットワーク(GNN)」を採用。これにより、原子一つひとつの局所的な状態や相互作用を柔軟に学習し、未知の構造に対しても高い精度での予測を可能にしています。
学習に用いたのは、Preferred Networksの計算基盤で実施した多種多様な構造のDFT計算のデータです。安定構造のみならず不安定な構造や非現実的な構造も取り入れ、PFP v7では構造数5900万以上の教師データを学習に用いました。この圧倒的な「データの質と量」が、PFPの前例のない汎用性の源泉です。

シミュレーションを加速する推論エンジン PFVM

Matlantisの圧倒的な計算速度は、PFPという優れたAIモデルと、その能力を最大限に引き出す実行ソフトウェアの両輪によって実現されています。
その中核を担うのが、独自に開発した推論エンジン「PFVM」です。PFVMは、「カーネル融合」をはじめとする最適化技術を用いてPFPの計算を効率化するコンパイラの役割と、それをハードウェア上で高速・省メモリに実行するランタイムの役割を兼ね備えています。
このように、高性能なAIモデルであるPFPの能力を、専用に開発された推論エンジンPFVMが最大限に引き出すことで、他の追随を許さないシミュレーション環境が実現されています。