第一原理に基づいた信頼性の高い結晶構造予測

ニュース

ホームページホームページ / ニュース / 第一原理に基づいた信頼性の高い結晶構造予測

Apr 26, 2023

第一原理に基づいた信頼性の高い結晶構造予測

Volume sulle comunicazioni sulla natura

Nature Communications volume 13、記事番号: 3095 (2022) この記事を引用

3507 アクセス

8 件の引用

8 オルトメトリック

メトリクスの詳細

分子結晶構造予測 (CSP) のための安価で信頼性の高い方法が開発されました。 新しい CSP プロトコルは、結晶のモノマーの 2 次元グラフから始まり、実験情報は一切利用しません。 分子ダイマーの量子力学的計算の結果を使用して、結晶に対する正確な二体剛体モノマー非経験ベースの力場 (aiFF) が開発されます。 aiFF を使用した CSP は本質的に経験的 FF と同じくらい高価であるため、結晶充填手順によって生成される何万もの妥当な多形を最適化できます。 ここでは、調査した 15 分子のそれぞれについて、20 の最も安定な予測多形の範囲内で実験結晶を見つけたこのプロトコルの堅牢性を示します。 これらの上位 20 個の多形に対して周期密度汎関数理論 (DFT) と分散補正 (pDFT+D) の計算を実行することで、ランキングがさらに洗練され、その結果、実験用結晶が研究されたすべてのシステムで 1 位にランクされました (そして 2 位も多形体が知られている場合は、上位数名にランクされます)。 あるいは、生成された多形を使用して aiFF を改善することもでき、これはランク 1 の予測にもつながります。 提案された CSP プロトコルは、CSP 研究における経験的な FF に代わる aiFF をもたらすはずです。

結晶固体の特性は、特定の物質の多形形態に大きく依存し、多くの結晶はいくつかのそのような形態で存在できます1、2。 結晶の安定した多形形態の可能性についての知識は、製薬業界にとって特に重要です3。 研究室で得られた多形とは異なる多形が医薬品の製造中に結晶化すると、異なる物理化学的特性を持ち、望ましくない治療効果をもたらす可能性があります。その 2 つの例はリトナビル 4、5 とロチゴチン 6、7、8 です。 したがって、医薬品開発プロセスでは、使用される多形が周囲条件で熱力学的に最も安定した形態であるかどうかを知りたいと考えます。 防衛産業では、高エネルギー材料の開発は費用がかかり、非常に危険である9,10。概念的な材料の結晶構造についての先験的な知識があれば、そのような材料のスクリーニングを迅速に行うことができるでしょう。 また、半導体産業もそのような知識から恩恵を受けることができます11。 CSP メソッドは、この分子に特有の実験情報を使用せず、二次元図から開始して特定の分子の最も安定な結晶多形のセットを見つけることで、これらのニーズに応えます。

モノマーの 2 次元図のみの知識から出発して分子結晶の信頼できる CSP を作成することは、長い間ほぼ不可能でした。 1988 年に Maddox12 は、CSP の失敗は物理科学における継続的なスキャンダルであると述べ、一般に最も単純な結晶固体でさえ大きな課題を引き起こすと述べました。 1990 年代半ば、ガヴェッツォッティ 13 は「結晶構造は予測可能ですか?」という基本的な質問をしましたが、彼の答えは「ノー」でした。 この批判に応えて、ケンブリッジ結晶学データセンター (CCDC) は、測定されたものの公表されていない結晶のモノマーの 2 次元図のみを提供することにより、一連の「ブラインド」テスト 14、15、16、17、18、19 を実施しました。この分野は最初のテスト以来大幅に進歩しましたが、最後の 6 回目のテスト 19 の結果はまだ完全に満足のいくものではありません。 参加グループは 13% ~ 57% の成功率を達成しました (系 XXIII の多形体 C および E は含まれません)。成功とは、それぞれ 100 個の多形体を含む 2 つのリスト上の多形体の中から実験的多形体が見つかったことを意味します。

ここで、結晶構造の予測は、Maddox12 が示唆したこととは逆に、実際には物理科学にとって難しい問題であることに留意する必要があります。 その理由は、構造空間および結晶空間が高次元であるため、格子エネルギーと密度の比較的狭い範囲内でこの空間をサンプリングすることによって、数千もの妥当な多形が生成されるためです。 格子エネルギーによって順序付けられた連続する多形間のエネルギー距離は、低エネルギー端で 1 kJ/mol 程度であり、経験的な FF では達成がほぼ不可能な精度が必要です。 また、実験的に観察された多形の場合、それらの計算された格子エネルギーの差は同じオーダーです 20。

最近のディープ ニューラル ネットワークの使用など、CSP にはいくつかのバリエーションがありますが 21、第 6 回ブラインド テストに参加したグループの大部分は、ほとんどが経験的な性質を持つ何らかの形式の FF を使用していました。 多形空間サンプリングと格子エネルギー最小化からなる最も成功した CSP プロトコルは、Neumann らによって開発されました 22,23。 このプロトコルは、経験的な FF のパラメータを調整して pDFT+D 格子エネルギー (およびその導関数) をできるだけ再現することによって得られる、オーダーメイドの FF を使用します。 pDFT+D 計算の初期多形は、経験的な FF を使用して取得されます。 この方法は商用ソフトウェア パッケージ GRACE (Generation Rank and Characterization Engine)24 に含まれていますが、その詳細の一部は利用できません。 CSP の分野に関する最近のレビューは参考文献にあります。 25、26、27、28、29、30、31。

現在の研究では、CSP プロトコルは完全に第一原理に基づいて提案されており、実験情報は一切利用されていません。 この方式の主な特徴は aiFF を使用することであるため、これを CSP(aiFF) プロトコルと呼びます。 このプロトコルは、図 1 に示すいくつかの段階で構成されています。aiFF はしばらくの間 CSP で使用されてきました 19,32,33,34 が、そのような予測には長い時間がかかり (最低でも数か月)、膨大な量の人的労力が必要でした。 、最大約 20 個の原子を持つモノマーについては可能でした。 現在の研究では、コストを劇的に削減し、そのような CSP の予測可能性を高めるために、4 つの最近の開発が組み合わされています。 (b) autoPES の作成 37,38: 人間の関与を最小限に抑えた位置エネルギー面 (PES) の生成のための自動で効果的かつ信頼性の高い方法。 (c) 現在の研究の一部である、CSP の格子エネルギー最小化段階でのこのような aiFF の使用を可能にする。 (d) 多形ランキングの最終改良のための pDFT+D の適用。 図 1 のステージ 3 では、低コストで数百万の多形体さえも生成でき、過去の経験から、実験に関連する多形体がほとんどの場合その中に含まれることが示されています。 したがって、CSP プロトコルの本質は、このセットから関連するすべての低格子エネルギー多形をフィルタリングすることです。 過去数年間で、多形の pDFT+D 幾何学最適化により実験的多形が上位数位にランクされ、多くの場合 1 位にランクされることがいくつかのグループによって実証されています 19,39,40,41。 しかし、そのような計算は非常に高価であるため、100 程度の多形に対してのみ実行できます。 対照的に、ステージ 4 で FF を使用すると、数万の多形を最適化できます。 この FF は、重要な多形を見逃さないように十分に正確である必要があります。 したがって、ab initio 法とこの方法を使用して計算された相互作用エネルギーへの適合の両方の不確実性が十分に小さい必要があります。 二量体相互作用エネルギーの計算では、我々が使用する SAPT の変形 (「方法」を参照) は、単一、二重、および非反復三重励起による結合クラスター法 CCSD(T) とほぼ同じ精度です 35,42,43。電子構造理論の「ゴールドスタンダード」手法ですが、大幅に安価です。 フィッティングによる精度の損失を防ぐために、フィッティング関数の形式は、通常レナード・ジョーンズとクーロン ポテンシャルから構築される経験的 FF の形式よりも大幅に複雑にする必要があります。「方法」を参照してください。 拡張形式は、約 1 kJ/mol の不確かさで ab initio データを適合させることができ、信頼性の高い CSP としては十分であることが示されます。 このような形式は格子エネルギーの最小化に使用されたことがなく、それを可能にするために CSP ソフトウェアを修正する必要がありました。 最後に、ステージ 2 を手頃な価格にするには、aiFF に適合させるために必要な ab initio グリッド ポイントの数が適度に少なくなければなりません。 autoPES 法 37,38 は、一般的な表面フィッティング手法と比較してこの数値を 2 桁削減し、これにより開発コストを同じ比率で削減します。 また、プロセス全体が完全に自動化されているため、人間の関与がほぼゼロになります。 以下に、提案されたプロトコルにより、実験対象の結晶が研究された 15 分子すべてで第 1 位にランク付けされたことを示します (また、2 番目の多形が既知であれば、上位数個にランク付けされます)。

ステージ 1: モノマーのエネルギーを最小化し、平衡形状を見つけます。 ステージ 2: 二量体の分子間相互作用エネルギーの ab initio 計算に続いて、解析形式の aiFF をこれらのデータにフィッティングします。 ステージ 3: さまざまな空間群、モノマーの配向、および単位格子パラメータをサンプリングすることによって、多形の妥当な充填配置を数百万個生成し、その後、密度基準または単純な格子エネルギー最小化を使用して、このセットを数万の多形に縮小します。 FF。 ステージ 4: 縮小セット内のすべての多形に対して aiFF を使用した微細な最小化。 ステージ 5: ステージ 4 の上位 20 個の多形体に対する pDFT+D 計算によるランキングの改良。

私たちのメソッドのパフォーマンスを評価するために、CCDC ブラインドテスト 14、15、16、17、18、19 (ローマ数字で表示) のいくつかのシステムを含む 15 の分子、およびメタノール、ベンゼン、ニトロメタン、 5,5'-ジニトロ-2H,2'H-3,3'-ビ-1,2,4-トリアゾール (DNBT)、1-3-5-トリニトロベンゼン (TNB)、デフェリプロン、およびフルオロウラシル。 分子グラフを補足図 1 に示します。結果を表 1 にまとめます。この表の拡張版は補足表 1 にあります。

CSP(aiFF) プロトコルは、実験的多形体を 5 つのケースで 1 位、7 つのケースで 2 ~ 6 位、9、9、および 16 位にランク付けしました。また、システムのケースには 2 番目の実験的に同定された多形体も含めました。 I、ベンゼン、およびデフェリプロンは、表 1 では「Poly2」として示されており、これらはそれぞれ 8、4、および 8 位にランクされています。 各結晶の上位 20 個の多形体について pDFT+D 計算を行った後、さらなる形状の最適化を行わずに、実験用結晶がそれぞれの場合で 1 位にランクされました。 デフェリプロンの場合、ランク 1 多形になったのは Poly2 でしたが、Poly1 はランク 2 のままでした。システム I とベンゼンでは、Poly2 はそれぞれランク 8 から 2 と 4 から 3 に変化しました。 計算結晶と実験結晶の間の RMSD20 は 0.09 ~ 0.67 Å の間で変動し、CCDC 閾値の 0.8 Å を下回ります。 また、補足表 1 に示されている密度とセルパラメータは非常によく一致しています。 補足の図2は、計算された格子パラメータと実験的な格子パラメータの間の偏差パーセントを表示します。 セル パラメーター a、b、c、β の平均誤差は、それぞれ 4.3%、2.6%、4.3%、2.4% になります。 このようなレベルの予測性は、完全に第一原理の CSP プロトコルでは前例のないものです。 実験的多形体と最も近い計算された多形体との重なりを図 2 に示します。この図により、これらの構造がどれほど近いかを直感的に理解できます。 CSP(aiFF) のこの並外れたパフォーマンスは、多形体の格子エネルギーの近さによる典型的な困難を示す調査対象システムにもかかわらず、また剛体モノマー近似の使用にも関わらず達成されました。 システムIVおよびXXIIのaiFF最小化からの格子エネルギー対密度の状況を補足図3に示します。他のシステムの類似のグラフも同様に見えます。 最低エネルギーの 100 多形は、システム I、XII、XIII、ベンゼン、およびニトロメタンでは約 5 kJ/mol、システム II、IV、VIII、XVI、XXII、メタノール、TNB、デフェリプロンでは約 10 kJ/mol の範囲に広がります。 、フルオロウラシル、DNBT の場合は約 20 kJ/mol。 低エネルギー端では、連続する多形間のエネルギー差は 1 kJ/mol 未満です。つまり、表 1 に示す、負の相互作用エネルギーを持つすべての二量体配置にわたる当てはめの RMSE に匹敵します。

システムの SAPT(DFT) ベースの aiFF を使用して、実験的な結晶構造 (元素固有の色) と最も近い計算された結晶構造 (緑色) を重ね合わせます: a および b I、c II、d IV、e VIII、f XII、g XIII、h XVI、i XXII、j メタノール、k および l ベンゼン、m ニトロメタン、n DNBT、o TNB、p および q デフェリプロン、r フルオロウラシル。

一部の経験的 FF で使用される単純な exp-6-1 形式 (指数関数や減衰関数などの前に多項式は含まれません。「方法」を参照) の代わりに、格子エネルギーの最小化に aiFF の拡張関数形式を使用します。ランキングの大幅な向上につながります。 このような改善を定量化するために、システム I、II、IV、XXII に対して、拡張形式の場合と同じレベルの理論を使用してフィッティングした exp-6-1 形式の aiFF で格子エネルギーの最小化を実行し、ランキングを達成しました。表 1 を参照してください。この改善の主な理由は、負の相互作用エネルギーの RMSE が 2.3 から 5.3 になったことです。後者の場合は 1 倍小さくなります (これらの比率は適合パラメーターの数と相関しています。たとえば、システム IV の場合、exp-6-1 と拡張形式ではそれぞれ 30 と 270)。

私たちのアプローチの予測力をより適切に定量化するために、上記の計算と同様の計算が経験的な FF を使用して実行されました。 私たちは、CHELPG メソッド 45 を使用して計算されたポイント料金を持つ W99 FF44 を選択しました。 検討した 18 の実験的多形について、W99+charges FF ではランク 10 以上が 33% でしたが、aiFF (pDFT+D ステップなし) の同様の結果は 94% でした。 これは、技術的応用においては質的な違いとなります。 W99+charges FF を備えた CSP の詳細については、補足表 1 および 2 を参照してください。

ベンチマーク相互作用エネルギーに関するいくつかの比較が行われているのに、ランキングを改善するためになぜ pDFT+D 計算が必要なのか疑問に思う人もいるかもしれません。たとえば、参考文献を参照してください。 図 42、43 は、SAPT(DFT) が CCSD(T) とほぼ同じ精度であり、DFT+D 方法よりも正確であることを示しています。 主な理由は、CSP で使用されているのが aiFF であり、フィッティングによる追加の不確実性が含まれていることです。 負の相互作用エネルギーの平均フィッティング誤差はわずか約 1 kJ/mol ですが、構成によっては誤差がさらに大きくなる場合があります。 相互作用エネルギーが負すぎる配置が多形にとって重要である場合、この多形は安定しすぎて、ランクが高すぎる可能性があります。 他に考えられる 2 つの理由、基底関数セットのサイズと CSP(aiFF) における多体効果の無視については、補足情報で説明されていますが、理由である可能性は低いと考えられます。 ステージ 4 からの予測を改善するために、私たちはメソッドの代替バージョンである alt-CSP(aiFF) を開発しました。 pDFT+D 段階を除いた CSP(aiFF) プロトコルを実行した後、最も低い格子エネルギーを持つ 20 個の多形体の幾何学的形状が検査され、連続した最近傍二量体が特定されます。 次に、これらの二量体に対して SAPT 計算が実行され、aiFF が再フィッティングされ、新しい aiFF を使用して 20 個の多形の格子最小化が実行されます。 この手順は、各多形から抽出された 5x5x5 クラスターのエネルギーが、aiFF からのみ計算される方法と、aiFF 相互作用エネルギーを利用可能な SAPT エネルギーで置き換えるハイブリッド方法の 2 つの方法で計算され、一定のしきい値内で同じになるまで繰り返されます。 表 1 の最悪ランクの結晶のうち 2 つ、システム XVI (ランク 16) とフルオロウラシル (ランク 9) に alt-CSP(aiFF) を適用しました。 それぞれの場合において、alt-CSP(aiFF)はランク1の実験的多形をもたらしたが、RMSD20はそれぞれ0.29から0.15Åおよび0.61から0.42Åに減少した。 したがって、alt-CSP(aiFF) は pDFT+D ステージなしで使用できます。 ただし、追加の ab initio 計算は pDFT+D 計算とほぼ同じくらい高価であるため、効率の点では何のメリットもありません。

提案された方法は、上に示したように信頼性が高いだけでなく、FF ベースの CSP と pDFT+D 計算を組み合わせる別の方法と比較して非常に効率的です。 これを実証するために、図 3 に、システム I の例におけるシングルコアのウォールタイムの観点から、考えられる 3 つの CSP 戦略のコストを示します。このタイプの計算は通常、数百のコアで実行されるため、実際のウォールタイムはここで提案されているアプローチである戦略 1 の場合、所要時間はわずか数時間です。 戦略 1 の時間の大部分 (7 コア日) は、aiFF の開発に費やされ、この時間の大部分は、706 個の二量体構成の SAPT(DFT) 相互作用エネルギーの計算に使用され、これらのエネルギーのフィッティングに費やされる時間はほとんどありません。 。 次の段階である数十万個の結晶のパッキングと最小化 (PACK+MIN) には、1 日の 3 分の 1 もかかりません。 最終段階である aiFF ジオメトリでの上位 20 個の多形の pDFT+D 計算には、約 1 日かかります。 仮説戦略 2 は、PACK+MIN ステージで経験的な FF を使用することと、ジオメトリの再最適化を伴う 100 個の多形に対して pDFT+D 計算を実行する点で戦略 1 と異なります (この多形の数は、成功率と結果のトレードオフとして選択されました)。計算コスト)。 後者の段階に必要な時間は 70 コア日になるため、戦略 2 は戦略 1 よりも約 1 桁高価になります。さらに、W99 + チャージ FF が使用された場合、セットでの戦略 2 の成功率は、ここで調べた 18 個の多形の確率は 72% (補足表 2 を参照) ですが、戦略 1 の成功率は、トップランクの 16 個の多形ですでに 100% です。 すべての PACK+MIN バーは、aiFF と経験的 FF でほぼ同じ高さであるように見えます。 これは、前者の場合、格子エネルギーの計算にかかるコストが約 2 倍にすぎないためです。 仮説戦略 3 では、PACK+MIN によって生成された 25,500 個の多形すべてに対して幾何学最適化を使用して pDFT+D 計算を実行します。 この戦略は非常に高い信頼性を持つと思われます (実験的多形体は、このような大規模な候補構造のプールにほぼ常に含まれることが実際に示されているため) ですが、シングルコア年で 49 年と非常にコストがかかるため、実用的ではありません (可能ではありますが)数千コアが使用された場合)。 経験的な FF を使用すると、pDFT+D ステージに含まれる多形の数を 100 ~ 25,000 の範囲で設定でき、戦略 2 と比較してコストと信頼性を体系的に向上させることができます。ただし、W99+ チャージと多形のセットでは、多形数が少なくとも 589 になるまで、成功率は 72% に留まります。戦略 2 および 3 の場合、PACK+MIN ステージは、必要な数の候補多形を生成する他のプロトコルに置き換えることができ、合計に対する影響はわずかです。タイミング。

さまざまな戦略を使用したインテル E5-2670 プロセッサーの単一コア上のシステム I CSP に必要な合計ウォールタイム。 「aiFF」、「PACK+MIN」、「pDFT+D」の行は、aiFF の展開、パッキング、最小化、および定期的な DFT+D 計算の時間を示します。

aiFF は 2 体相互作用の合計であるため、前述し、補足情報で説明した多体効果は無視されます。 これらの効果は、ここで検討した結晶の CSP では重要ではないことを示していますが、他のいくつかの結晶では重要である可能性があります 46、47、48。 最も重要な多体効果である多体分極は、autoPES を使用して開発できる分極可能な aiFF を使用して説明できますが、CSP コードにはまだ実装されていません。 補足情報では、使用した比較的小さな基底関数セットが CSP に適切である理由も説明します。 さらに重要な無視されている影響は、モノマーの柔軟性です。 我々が検討したモノマーは剛体であると想定されていましたが、提案されたCSP(aiFF)プロトコルは柔らかい自由度を持つモノマーにも適用できます。 このようなモノマーは、気相での平衡構造と比較して、結晶中で著しく変形する可能性があります。 autoPES38 の最新バージョンには、すべてまたは選択されたモノマー内自由度を考慮した相互作用エネルギーを計算する機能があり、ほとんどの CSP コードはすべての自由度を含むパッキングと最小化を実行できるため、そのような予測は依然として第一原理から完全に行うことができます。 ただし、そのような計算のコストは、自由度の総数に応じて急激に増加します。 この問題を回避する 1 つの方法は、すべての生体分子 FF およびフレキシブル モノマー CSP で使用されるすべての FF で行われているように、ステージ 2 でモノマー間およびモノマー内の自由度の分離を仮定することです。 私たちの aiFF は異なるモノマーの原子間の距離のみに依存するため、相互作用エネルギーは任意のモノマー構成に対して計算できます。 このような「柔軟化された」モノマー間 FF は、現在の経験的な FF のモノマー間成分を置き換えることができますが、モノマー内成分は変化させずに保つことができます。 このような置き換えにより、フレキシブルモノマー CSP の予測が改善されることが期待できます。

現在のバージョンの CSP(aiFF) で無視されている他の効果は、熱効果とエントロピー効果です。これは、私たちが提示した結果が 0 K の温度に対応しているためです。 Brandenburg と Grimme によって指摘され 39、最近 Hoja et al.41 によって広範に調査されたように、一部の結晶では、これらの効果が多形のランキングを変える可能性があります。 熱効果とエントロピー効果は pDFT+D を使用して日常的に計算できますが、そのような計算は静的ジオメトリでの pDFT+D 計算よりも数倍高価です。 テストとして、系 XXII の 5 つの最も低い格子エネルギー多形について両方の効果を計算しましたが、ランキングは変わりませんでした。

ここで開発された第一原理 CSP(aiFF) 法は、18 の既知の実験的多形を持つ 15 個の剛直な分子の結晶に適用されました。 これらの分子の結晶の CSP に aiFF を適用すると、17 または 94% の多形が 1 ~ 10 の範囲にランク付けされ、残りの多形はランク 16 になります。比較のために、経験的な W99+ 電荷 FF を持つ類似の CSP は 33 ランクにすぎません。 1 ~ 10 の範囲の多形の %、生成された 568 個以上の中に 3 つの実験的多形が見つからず、2 つの分子については原子タイプが欠落しているため予測できませんでした。 CSP(aiFF) の数万の多形を最小限に抑える能力は、この段階で精度の低い方法を使用する必要があり、多くの場合誤って正しい構造の破棄につながる代替アプローチに比べて重要な利点です。 その後、固定された aiFF ジオメトリでの pDFT+D 計算による上位 20 の多形の再ランキングにより、15 分子すべてについて実験的多形が 1 位にランク付けされ、2 番目の多形は 2、2、および 3 にランク付けされました。 aiFF [alt-CSP(aiFF) プロトコル] の前回の反復で予測された結晶から抽出された二量体に対して ab initio 計算を実行することによって aiFF が反復的に改善される場合、D ステップは省略できます。 提案された CSP プロトコルは、テストされたシステムの最終的な予測能力を示すだけでなく、他の高度な予測アプローチと比較して安価でもあります。 約 100 個のコアでは、ここで調査したシステムの完全な予測には、aiFF 世代も含めて 1 日もかかりません。 CSP(aiFF) プロトコルは最小限の人的関与を必要とし、autoPES、UPACK、および pDFT+D 計算のための入力準備のみで構成され、オープン ソース コードを備えたフリー ソフトウェアのみが含まれています。 CSP(aiFF) 方法論の現在の実装の制限、特に多体相互作用と剛体モノマー近似の無視について議論されています。 テストセットには均質な結晶のみが含まれていましたが、aiFF の品質は二量体が均質であるか不均質であるかに依存しないため、この方法が塩を含む共結晶に対しても同様にうまく機能することを疑う理由はありません (もちろん、2 成分共結晶の場合は、 3 つの PES を開発する必要があります)。 また、最大のテスト分子には 22 個の原子が含まれていましたが、SAPT(DFT) の相対精度はシステム サイズによって変化しないため、この方法はより大きな分子にも同様にうまく適用できるはずです 35。 もちろん、サイズが大きくなるほど計算コストは​​高くなりますが、原子数が 100 個程度の分子であれば実現可能です。 提案された CSP プロトコルの有効性は、他の正確な電子構造法と比較して計算効率が高い SAPT(DFT) 法の使用と、aiFF のフィッティングに autoPES 法を使用したことによるものです。この方法はコストを削減するだけではありません。それだけでなく、この最も自動化が難しいステップにおける人間の労力もほぼゼロにまで削減されます。 CSP(aiFF) プロトコルの重要な要素は、以前のすべての CSP プロトコルで使用されていた単純なポテンシャル形式を、不確実性が大幅に減少した非経験的相互作用エネルギーをフィッティングできる拡張形式に置き換えることです。 提案されたプロトコルの利点は、結晶構造と特性を調査するための完全な第一原理手順を構成することです。 このようなプロトコルは、経験的な FF を使用するプロトコルとは対照的に、どのような種類のモノマーに対しても同様にうまく機能するはずです。経験的な FF を使用するプロトコルは、そのような FF のフィッティングに使用されるものと同様のシステムでのみうまく機能すると予想されます。 私たちは、提案された CSP プロトコルの全体的な効果は、CSP の分野が経験的 FF の使用から aiFF に移行することになると考えています。 これにより予測の信頼性が高まるはずであり、したがってCSPはこれまで技術開発において最良の助言的役割を果たしてきたが、新規結晶材料の開発においては主導的な要素となる可能性がある。 より一般的には、aiFF はいくつかのタイプのコンピューティング マテリアル デザインで使用できます。

ステージ 1 では、aug-cc-pVTZ53 基底セットの PBE51 関数および D3 補正 52 を備えた ORCA49,50 を使用して、モノマー形状が最適化されました。

CSP(aiFF)プロトコルを実用化するには、数十の原子を持つモノマーに対して、ステージ2でかなり低コストで、同時に小さな不確実性でaiFFを構築する必要があります。 これには、分子間相互作用エネルギーの計算に使用される非経験法が安価で正確であることがまず必要です。 このような計算に現在最適な選択肢は、単離されたモノマーから開始して正しい電子順列対称性を課し、相互作用エネルギーを直接計算する非経験法である SAPT36,54 であると思われます。 DFT に基づいて SAPT バリアント、SAPT(DFT)55、56 を適用しました。参考文献を参照してください。 この方法の最近のレビューについては、35 を参照してください。 SAPT(DFT) および CCSD(T) の計算は \({{{{{{\mathcal{O}}}}}}}}({n}^{5})\) および \({{{ {{{{\mathcal{O}}}}}}}}({n}^{7})\) をそれぞれ系のサイズに置き換えます。ここで、n は電子の数であり、数十個の原子を持つ二量体の場合は, SAPT(DFT) 計算は、CCSD(T) 計算よりも約 2 桁安価です。 最近開発された新しい SAPT(DFT) アルゴリズムと効果的なコンピューター コード 35,42 を使用すると、合理的なコンピューター リソースを使用して、原子数が約 100 のモノマーを持つダイマーの数千の格子点を計算でき、十分な数があれば数日でこれを達成できます。のコンピュータコアが利用可能です。

SAPT(DFT)55,56,57,58 の 1 次および 2 次相互作用エネルギーの計算の詳細は以下のとおりです。 モノマーの計算には、ORCA パッケージ 49,50 と接続された SAPT202061 コードの密度フィッティング バージョン 35,59,60 を使用しました。 PBE51 関数は、勾配制御漸近補正 (GRAC) を適用する DFT 計算に使用されました 62,63。 aug-cc-pVDZ53 基底関数セットと 3s3p2d2f ミッドボンド関数のセット (autoPES のデフォルト) は、モノマー中心プラス基底関数セット (MC+BS) フォーマットで使用されました64。 高次の誘導効果と交換誘導効果を説明する項。 \(\delta {E}_{{{{{{{\rm{int}}}}}}} で示されます。{{{{{ {{\rm{resp}}}}}}}}^{{{{{{{\rm{HF}}}}}}}}}\) であり、Hartree-Fock (HF) の差として得られます。 ) 相互作用エネルギーと、その応答 (それぞれ) バージョンにおける適切な SAPT(HF) 一次補正と二次補正の合計が、システム XIII、ベンゼン、DNBT、および TNB を除くすべてのシステムに含まれていました。 SAPT 相互作用エネルギー成分には簡略表記を使用します。「indx」は、二次誘導成分と交換誘導成分、および \(\delta {E}_{{{{{{ {{\rm{int}}}}}}}、{{{{{{{\rm{resp}}}}}}}}}^{{{{{{{\rm{HF}} }}}}}}}\) 寄与、「dispx」は分散成分と交換分散成分の合計、「elst」は静電成分、「exch」は 1 次交換成分です。 魅力的なコンポーネントの相対的な重要性を補足図4に示します。

過去のすべての CSP では、格子エネルギー最小化段階では単純な FF のみが使用されてきました。 最もよく使用される 2 つの形式は、Lennard-Jones 12-6-1 ポテンシャル: A12/r12 − C6/r6 + qaqb/r とバッキンガム exp-6-1 ポテンシャル: Ae−βr − C6/r6 + qaqb/ です。 r、ここで r は原子間の距離、A12、A、β、C6、qa、qb は調整可能なパラメーターです。 SAPT(DFT) ベースの aiFF は CSP で使用されていますが、最小化段階では常に exp-6-1 ポテンシャル形式を使用します。 この形式は、ab initio データにうまく適合するほど柔軟ではないため、信頼できる CSP としては大きすぎる数 kJ/mol の不確実性が生じます。 対照的に、CSP(aiFF)プロトコルで私たちが使用する拡張形式は、約1 kJ/molの不確かさでab initioデータに適合でき、信頼性の高いCSPには十分であることが示されています。 この関数形式は 37,38 です。

ここで、a (b) は、それぞれモノマー A (B) の原子セット、αab、βab、\({a}_{i}^{ab}\)、\({A}_{12}^) を表します。 {ab}\) は反発エネルギー パラメーター、\({C}_{n}^{ab}\) は長距離分散と誘導エネルギー パラメーター、qx、x = a、b、原子の部分電荷、\ です。 ({\delta }_{n}^{ab}\) は減衰パラメーター、fn は Tang-Toennies65 減衰関数です: \({f}_{n}(\delta ,r)=1-{e} ^{-\delta r}\mathop{\sum }\nolimits_{m = 0}^{n}{(\delta r)}^{m}/m!\) 長距離相互作用エネルギーは ab を使用して計算されました初期分散アプローチ。 分散と誘導項の減衰パラメータは、すべての近距離 2 次成分と \(\delta {E}_{{{{{{{{\rm{int}}}}} の合計) に個別にフィッティングされました。 }}}、{{{{{{{\rm{resp}}}}}}}}^{{{{{{{{\rm{HF}}}}}}}}\)、 \({\delta }_{1}^{ab}\) は静電エネルギーに当てはめられました。 ここで開発されたすべての PES は 2 体の 6 次元 PES です。つまり、剛直なモノマーを想定しています。 aiFF は、これらの 2 体 PES の合計として構築されました。 式で与えられる FF の拡張形式は次のとおりであることを付け加えておく必要があります。 (1) は一部の公開された CSP で使用されていますが、ステージ 5 の pDFT+D 計算を置き換えることができる分子動力学 (MD) シミュレーションでのみ使用されています。MD 計算は pDFT+D 計算とほぼ同じくらい高価であり、pDFT+D 計算よりも大幅に高価であることに注意してください。ステージ4の最小化。SAPT(DFT)相互作用エネルギー成分とモノマーの質量中心間の距離Rの関数としてのそれらの適合を示すグラフは、補足図5に含まれています。特に、非経験的な静電エネルギーがは、減衰された電荷-電荷相互作用のみを使用する、つまり高次の多極項を省略しているにもかかわらず、ファンデルワールスの最小距離 RvdW よりも大きい R について非常によく再現されます。 経験的 FF で後者の項を使用すると、電荷のみを使用した場合と比較して予測が向上します 66,67 が、静電関数に減衰が含まれており、ab initio 静電エネルギーに適合している場合には、高次の多極子は必要ないことが、我々の結果で示されています。 R < RvdW で見られる ab initio 値との一致の悪化は避けられず、これは R36 の逆べき乗に比例しない電荷重複効果によるものです。 これらの効果は、式 1 の最初の項による全体的な適合で説明されます。 (1)。 これが、総適合エネルギーと非経験相互作用エネルギーがすべての R で見事に一致する理由です。

利用可能な CSP パッケージはいずれも、式で与えられる aiFF の形式を使用できないため、 (1) では、ステージ 3 と 4 で適用されるように、MOLPAK68 と UPACK69 の 2 つのパッケージを変更しました。MOLPAK は配位幾何学の概念を使用し、デフォルトで 26 の空間グループで検索します: P1、\(P\bar{1}\ )、P2、Pm、Pc、P21、P2/c、P21/m、P2/m、P21/c、Cc、C2、C2/c、Pnn2、Pba2、Pnc2、P221、Pmn21、Pma2、P21212、P212121、 Pca21、Pna21、Pnma、Fdd2、Pbcn、および Pbca。 中心分子の配向を 10∘ 刻みで体系的に変化させることにより、3 次元検索空間のグリッド上に多形を生成します。 この生成は、51 個の調整ジオメトリすべてで実行されます。 単位格子内のパッキングは、原子間の単純な反発 1/r12 相互作用によって制御されます。エネルギー閾値に達するまで分子は集まります。 このステップでは、6859 個の角度の組み合わせ × 51 個の配位ジオメトリ = 349,809 個の仮想多形の初期セットが提供されます。 このセットから、プログラム WMIN70 を使用して、各配位幾何学から 500 個ずつ、25,500 個の最も密度の高い多形が最小化されます。 WMIN の FF のデフォルトの関数形式は exp-6-1 です。 このコードを修正して、式 1 の形式の FF を含めました。 (1)。

UPACK は 13 のデフォルト空間群でランダムな結晶構造を生成します: C2、C2/c、Cc、P1、\(P\bar{1}\)、P21、P21/c、P212121、Pbca、Pc、Pbcn、Pca21、および Pna21 。 12-6-1 の任意のポテンシャルを使用できるため、OPLS-AA FF71 を選択しました。 UPACK のパッキング段階は 2 つのステップに分かれています。 最初のステップでは、対称グループあたり 500 個の妥当な構造のみが無制限の方法でランダムに生成され、セルの寸法を推定するために使用されます。 2 番目のステップでは、このセル推定を使用して、制限された座標空間でランダム生成が実行されます。 生成された構造のほとんどは、原子間 12-6-1 相互作用がどのペアでも 2000 kJ/mol を超えてはいけないという基準を使用して、すぐに拒否されます。 このような世代とエネルギー基準のテストは、対称グループあたり 5000 個の多形体、つまり合計 65,000 個の多形体が見つかるまで続けられます。 この 2 番目のステップには、格子エネルギーの大まかな最適化も含まれます。 結果として得られるリストは、重複を除去するためにクラスタリング72の対象となります。 クラスタリングによりプールが大幅に削減されます。 たとえば、システム XXII の場合、多形数は 13,014 個に減ります。

UPACK で実現される CSP(aiFF) のステージ 4 では、縮小されたセットからのすべての多形が厳しいしきい値で最小化されます。 UPACK を修正して、式 1 の形式の FF を使用できるようにしました。 (1)。 最初に OPLS-AA FF を使用して、つまりクラスタリングを含む元の UPACK パスを使用してステージ 4 を実行し、次に aiFF を使用して縮小セットを最小化することが有利であることがわかりました。 この手順は時間を節約するためではなく、結果としてわずかな節約にはなりますが、最小化が FF の「穴」、つまり非常に短いモノマー間分離における非物理的最小値に陥るのを避けるために選択されました。 構造上、12-6-1 FF には穴がありませんが、exp-6-1 および拡張形式の FF にはほとんど常に穴があります (ただし、autoPES フィッティングの制約の 1 つである約 100 kJ/mol バリアの背後にあります)。 OPLS 最小化構造から開始する aiFF 最小化では、ホールが発生することはほとんどないことがわかりました。 12-6-1 FF を ab initio データに適合させることで、OPLS の使用を簡単に回避できたはずです。

私たちが修正した 2 つの CSP パッケージは、両方を使用した場合にほぼ同一の予測を生成しました。 MOLPAK は、システム I、II、XII、XXII、ニトロメタン、ベンゼンに使用されました。 UPACK は残りのシステムに使用され、同様に MOLPAK によって処理されたシステム I、II、XXII にも使用されました。 これら 3 つのシステムでは、2 つのパッケージによる実験用結晶のランキングは同一でした。

PLATON73 は、対称性の欠如 74 のチェックと、ターゲット結晶に適切な空間群およびセル パラメーターを割り当てることによる非標準設定から標準設定への空間群変換に使用され、表 1 のデータが得られました。たとえば、システム II の場合、MOLPAK とUPACK は実験結晶が P21/c 対称であると予測し、PLATON はそれを P21/n 対称に変換しました。

ステージ 5 では、周期的単一点 DFT+D 格子エネルギー計算、つまり幾何最適化を行わない計算が、擬ポテンシャルを使用した PBE51 汎関数 75 と Becke-Johnson による D3 分散補正 52 を使用して、aiFF 最小化からの上位 20 個の多形に対して実行されました ( BJ) 減衰76,77。 波動関数と電荷密度に対してそれぞれ 340 eV と 3061 eV の平面波運動エネルギーカットオフを持つ Quantum ESPRESSO (QE)78,79 コードを使用しました。

ゼロ点振動エネルギー (ZPVE) と熱効果は、QE で適用されたのと同じ DFT+D アプローチを使用して、Phonopy 2.8.180 および VASP 5.4.481、82、83、84、85 を使用した調和近似内で計算されました。 プロジェクターの拡張波擬似ポテンシャル 86,87 が使用されました。 結晶の緩和には、平面波基底関数セットのカットオフ 1000 eV が使用されました。 電子運動とイオン運動の 2 つのステップ間の総エネルギー変化がそれぞれ 10-5 eV および 0.5×10-2 eV より小さい場合、緩和は停止しました。 フォノン計算は、各方向に少なくとも 10 Å の長さのスーパーセルを使用して Γ 点で実行されました。 緩和ステップと同様に、平面波基底関数セットのカットオフ 1000 eV と収束閾値 10-8 eV が総エネルギー計算に使用されました。 次に、スーパーセル内で移動した原子の力定数から構築された動的マトリックスを使用して、ZPVE と熱効果が 8 × 8 × 8 のメッシュで計算されました。

この研究の結果を裏付けるデータは、記事と補足情報に含まれています。 特に、.zip ファイルには、計算されたすべてのデータ ポイントの座標とエネルギー、フィットのパラメーター、およびトップランクの多形セットの結晶学的情報ファイルが含まれています。

電子構造計算、フィッティング、CSP、および pDFT+D 計算に使用されるコード: SAPT、ORCA、autoPES (SAPT パッケージの一部)、MOLPAK、UPACK、Quantum Espresso、VASP は Web 上で入手でき、リンクが提供されています。本文および補足情報の参考文献に記載されています。 UPACK へのパッチは SAPT Web サイトから入手できます。 近似ポテンシャルを計算する FORTRAN プログラムは、Supplementary_Data_1.zip ファイルに含まれています。

Cruz-Cabeza, AJ、Reutzel-Edens, SM & Bernstein, J. 多態性に関する事実とフィクション。 化学。 社会 Rev. 44、8619–8635 (2015)。

論文 CAS PubMed Google Scholar

Bučar, D.、Lancaster, RW & Bernstein, J. 消滅する多形体再考。 アンジュー。 化学。 内部。 エド。 54、6972–6993 (2015)。

記事 CAS Google Scholar

Hilfiker, R. & von Raumer, M. (編) 製薬産業における多形性: 固体形態と医薬品開発 (Wiley-VCH、ワインハイム、ドイツ、2019)。

バウアー、J.ら。 リトナビル: 立体構造多型の異常な例。 薬局。 Res 18、859–866 (2001)。

論文 CAS PubMed Google Scholar

チェンブルカール、SR et al. 原薬プロセス開発の後期段階におけるリトナビル多形体の影響への対処。 組織プロセス解像度開発者 4、413–417 (2000)。

記事 CAS Google Scholar

Waknine, Y. ロチゴチンパッチは薬物の結晶化によりリコールされました。 メドスケープ (2008)。

Rietveld, IB & Ceolin, R. Rotigotine: 予測可能な全体的な単トロピック動作を伴う予期せぬ多態性。 J.Pharm. 科学。 104、4117–4122 (2015)。

論文 CAS PubMed Google Scholar

モルタザヴィ、M. et al. コンピューターによる多形スクリーニングにより、後から出現する難溶性のロチゴチンの形態が明らかになります。 通信化学。 2、70 (2019)。

記事 CAS Google Scholar

Badgujar, DM、Talawar, MB、Asthana, SN & Mahulikar, PP 現代エネルギー材料の科学技術の進歩: 概要。 J.ハザード。 メーター。 151、289–305 (2008)。

論文 CAS PubMed Google Scholar

Zhang、C. エネルギー材料のエネルギーと安全性、およびエネルギーと安全性の矛盾の起源。 推進剤が爆発する。 パイロテック。 43、855–856 (2018)。

記事 CAS Google Scholar

Jurchescu、OD et al. 有機半導体における電荷輸送に対する多形性の影響。 物理学。 Rev. B 80、085201 (2009)。

記事 ADS CAS Google Scholar

Maddox, J. Crystals の第一原理から。 Nature 335、201 (1988)。

記事 ADS Google Scholar

Gavezotti, A. 結晶構造は予測可能ですか? 準拠化学。 解像度 27、309–314 (1994)。

記事 CAS Google Scholar

Lommerse、JPM et al. 有機低分子の結晶構造予測のテスト。 アクタ・クリスタ。 B 56、697–714 (2000)。

記事 CAS Google Scholar

マザーウェル、WDS 他。 有機小分子の結晶構造予測: 2 回目のブラインド テスト。 アクタ・クリスタ。 B 58、647–661 (2002)。

記事 CAS Google Scholar

デイ、GMら。 結晶構造予測の 3 回目のブラインドテスト。 アクタ・クリスタ。 B 61、511–527 (2005)。

記事 CAS Google Scholar

デイ、GMら。 有機低分子の結晶構造の予測における大幅な進歩 - 4 回目のブラインドテストに関するレポート。 アクタ・クリスタ。 B 65、107–125 (2009)。

記事 CAS Google Scholar

バードウェル、DA et al. 複雑な有機化合物の結晶構造予測に向けて - 第5回ブラインドテスト報告。 アクタ・クリスタ。 B 67、535–551 (2011)。

記事 CAS Google Scholar

ライリー、AM et al. 第6回有機結晶構造予測法のブラインドテストの報告。 アクタ・クリスタ。 B 72、439–459 (2016)。

記事 CAS Google Scholar

Nyman, J. & Day, GM 多形間の静的および格子振動エネルギーの違い。 CrystEngComm 17、5154–5165 (2015)。

記事 CAS Google Scholar

Ryan, K.、Lengyel, J.、Shatruk, M. 深層学習による結晶構造予測。 混雑する。 化学。 社会 140、10158–10168 (2018)。

論文 PubMed CAS Google Scholar

Neumann, MA、Leusen, FJJ & Kendrick, J. 結晶構造予測における大きな進歩。 アンジュー。 化学。 内部。 エド。 47、1–5 (2008)。

記事 Google Scholar

マサチューセッツ州ニューマン 結晶構造予測のためのオーダーメイドの力場。 J.Phys. 化学。 B 112、9810–9829 (2008)。

論文 CAS PubMed Google Scholar

ノイマン、閣下。 アバンギャルドなマテリアル シミュレーション: フランス、サンジェルマン アン レー。 https://www.avmatsim.eu/ (2008)。

Day、GM 現在のアプローチは分子有機結晶構造の予測です。 クリスタロガー。 改訂 17、3–52 (2011)。

記事 Google Scholar

Price、SL 有機化合物の結晶構造を予測します。 化学。 社会改訂 43、2098 ~ 2111 (2014)。

論文 CAS PubMed Google Scholar

Szalewicz, K. 第一原理に基づく分子結晶の構造と特性の決定。 準拠化学。 解像度 47、3266–3274 (2014)。

論文 CAS PubMed Google Scholar

Hoja, J.、Reilly, AM、Tkatchenko, A. 分子結晶の第一原理モデリング: 構造と安定性、温度と圧力。 ワイリー・インターディシプ。 Rev.: コンピューティング。 モル。 科学。 7、e1294 (2017)。

Google スカラー

Oganov、AR 結晶構造の予測: 現状と課題についての考察。 ファラデーについて議論します。 R. Soc. 化学。 211、643–660 (2018)。

記事 ADS CAS Google Scholar

Price、SL および Brandenburg、JG 分子の結晶構造の予測。 量子化学と物理学における非共有結合性相互作用 (ジョージア州デラロザ編、AO およびディラビオ編) 333–363 (エルゼビア、2017)。

価格、SL 0 次結晶構造予測 (CSP_0) は成熟しつつありますか? 理想的な結晶構造予測コードは何を目指すべきでしょうか? ファラデーについて議論します。 R. Soc. 化学。 211、9–30 (2018)。

記事 ADS CAS Google Scholar

Podeszwa, R.、Bukowski, R.、Rice, BM & Szalewicz, K. 対称適応摂動理論からのシクロトリメチレン トリニトラミン 二量体のポテンシャル エネルギー曲面。 物理学。 化学。 化学。 物理学。 9、5561–5569 (2007)。

論文 CAS PubMed Google Scholar

Podeszwa, R.、Rice, BM & Szalewicz, K. 第一原理からの分子結晶の構造の予測。 物理学。 レット牧師。 101、115503 (2008)。

論文 ADS PubMed CAS Google Scholar

Misquitta, AJ、Welch, GWA、Stone, AJ & Price, SL C6Br2ClFH2 の結晶構造の第一原理予測。 化学。 物理学。 レット。 456、105–109 (2008)。

記事 ADS CAS Google Scholar

Garcia, J.、Podeszwa, R.、Szalewicz, K. は、分子間相互作用エネルギーの計算用の SAPT コードを作成しています。 J.Chem. 物理学。 152、184109 (2020)。

論文 ADS CAS PubMed Google Scholar

Jeziorski, B.、Moszyński, R. & Szalewicz, K. ファンデルワールス錯体の分子間ポテンシャルエネルギー面への摂動理論アプローチ。 化学。 改訂 94、1887 ~ 1930 年 (1994)。

記事 CAS Google Scholar

Metz, MP、Piszczatowski, K. & Szalewicz, K. 分子間ポテンシャル エネルギー面の自動生成。 J.Chem. 理論計算。 12、5895–5919 (2016)。

論文 CAS PubMed Google Scholar

Metz, MP & Szalewicz, K. 柔軟なモノマー分子間ポテンシャル エネルギー面の自動生成。 J.Chem. 理論計算。 16、2317–2339 (2020)。

論文 CAS PubMed Google Scholar

Brandenburg, JG & Grimme, S. 有機結晶多形性: 分散補正された平均場電子構造法のベンチマーク。 クリスタ。 Acta B 52、502–513 (2016)。

記事 CAS Google Scholar

Whittleton、SR、de-la Roza、AO & Johnson、分子結晶構造予測における正確なエネルギーランキングのための ER 交換孔双極子分散モデル。 J.Chem. 理論計算。 13、441–450 (2017)。

論文 CAS PubMed Google Scholar

Hoja, J. et al. 分子結晶多形の信頼性が高く実用的な計算による記述。 科学。 上級 5、eaau3338 (2019)。

論文 ADS PubMed PubMed Central Google Scholar

Garcia, J. & Szalewicz, K. Ab Initio 拡張 Hartree-Fock プラス分散法を数百の原子を持つ二量体に適用。 J.Phys. 化学。 A 124、1196–1203 (2020)。

論文 CAS PubMed Google Scholar

テイラー、DC 他分子間相互作用エネルギーに関する密度汎関数ベースの方法のブラインドテスト。 J.Chem. 物理学。 145、124105 (2016)。

論文 ADS PubMed CAS Google Scholar

デラウェア州ウィリアムズ ヌクレオシドおよびペプチド結晶への適用により、H、C、N、および O 原子を含む分子の分子間力場が改善されました。 J.Comput. 化学。 22、1154–1166 (2001)。

記事 CAS Google Scholar

Breneman, CM & Wiberg, KB 分子の静電ポテンシャルから原子中心モノポールを決定する。 ホルムアミド立体配座分析では高いサンプリング密度が必要です。 J.コンプ。 化学。 11、361 (1990)。

記事 CAS Google Scholar

Welch、GWA、Karamertzanis、PG、Misquitta、AJ、Stone、AJ & Price、SL 誘導エネルギーは有機結晶のモデリングに重要ですか? J.Chem. 理論計算。 4、522–532 (2008)。

論文 CAS PubMed Google Scholar

Karamertzanis、PG et al. 立体構造多形における分子間および分子内水素結合の相互作用のモデル化。 J.Chem. 物理学。 128、244708 (2008)。

論文 ADS PubMed CAS Google Scholar

グリーンウェル、C.ら。 相関波動関数法により、分子結晶の構造多形エネルギーを予測する困難を克服します。 化学。 科学。 11、2200–2214 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

Neese, F. ORCA プログラム システム。 ワイリー・インターディシプ。 Rev.: コンピューティング。 モル。 科学。 2、73–78 (2012)。

CAS Google スカラー

Neese, F. ORCA、ab initio、DFT、および半経験的電子構造パッケージ。 U. Becker らの寄稿による。 https://orcaforum.kofo.mpg.de。

Perdew, JP、Burke, K.、Ernzerhof, M. 一般化勾配近似を簡単に。 物理学。 レット牧師。 77、3865–3868 (1996)。

論文 ADS CAS PubMed Google Scholar

Grimme, S.、Antony, J.、Elrich, S. & Krieg, H. 94 要素 H-Pu の密度汎関数分散補正 (DFT-D) の一貫した正確な非経験パラメータ化。 J.Chem. 物理学。 132、154104 (2010)。

論文 ADS PubMed CAS Google Scholar

Kendall, RA、Dunning, TH Jr & Harrison, RJ 最初の列の原子の電子親和力を再検討します。 系統的な基底関数と波動関数。 J.Chem. Phys 96、6796–6806 (1992)。

記事 ADS CAS Google Scholar

Szalewicz, K. 対称に適応した分子間力の摂動理論。 ワイリーインターディスク。 Rev. Comp. モル。 科学。 2、254–272 (2012)。

記事 CAS Google Scholar

Misquitta, AJ、Podeszwa, R.、Jeziorski, B. & Szalewicz, K. 時間依存密度汎関数計算からの分散エネルギーを含む対称適応摂動理論に基づく分子間ポテンシャル。 J.Chem. 物理学。 123、214103 (2005)。

論文 ADS PubMed CAS Google Scholar

Hesselmann, A.、Jansen, G. & Schütz, M. 密度汎関数理論、密度フィッティングによる対称性に適応した分子間摂動理論: 分子間相互作用エネルギーを研究するための新しい効率的な方法。 J.Chem. 物理学。 122、014103 (2005)。

記事 ADS CAS Google Scholar

Misquitta, AJ、Jeziorski, B. & Szalewicz, K. モノマーの密度汎関数理論による分散エネルギーの説明。 物理学。 レット牧師。 91、033201 (2003)。

論文 ADS PubMed CAS Google Scholar

Hesselmann, A. & Jansen, G. 時間依存密度汎関数理論からの分子間分散エネルギー。 化学。 物理学。 レット。 367、778–784 (2003)。

記事 ADS CAS Google Scholar

Bukowski, R.、Podeszwa, R. & Szalewicz, K. 結合された Kohn-Sham 動的感受率関数と密度フィッティングによる分散エネルギーの効率的な計算。 化学。 物理学。 レット。 414、111–116 (2005)。

記事 ADS CAS Google Scholar

Podeszwa, R.、Bukowski, R. & Szalewicz, K. モノマーのコーン・シャム記述に基づく対称適応摂動理論における密度フィッティング法。 J.Chem. 理論計算。 2、400–412 (2006)。

論文 CAS PubMed Google Scholar

ブコウスキー、R. et al. SAPT2020: 分子間相互作用エネルギーの多体対称性に適応した摂動理論計算のための ab initio プログラム。 http://www.physics.udel.edu/~szalewic/SAPT/SAPT.html (2020)。

Grüning, M.、Gritsenko, OV、van Gisbergen、SJA & Baerends, EJ 内部領域と外部領域のモデル ポテンシャルの勾配制御によるシームレスな接続による交換相関ポテンシャルの形状補正。 J.Chem. 物理学。 114、652–660 (2001)。

記事 ADS Google Scholar

Cencek, W. & Szalewicz, K. 密度汎関数理論の漸近挙動について。 J.Chem. 物理学。 139、024104–(1:27) (2013)。 正誤表: 140、149902 (2014)。

記事 ADS CAS Google Scholar

Williams, HL、Mas, EM、Szalewicz, K. & Jeziorski, B. 分子間相互作用エネルギーの計算におけるモノマー、ダイマー、および結合を中心とした基底関数の有効性について。 J.Chem. 物理学。 103、7374–7391 (1995)。

記事 ADS CAS Google Scholar

Tang、KT & Toennies、JP 分散係数の普遍的な減衰関数に基づいたファンデルワールスポテンシャルの改良された単純モデル。 J.Chem. 物理学。 80、3726–3741 (1984)。

記事 ADS CAS Google Scholar

Day、GM、Motherwell、WDS & Jones、W. 剛体分子の結晶構造予測における等方性原子モデルを超えて: 原子多極子と点電荷。 クリスタ。 成長デス。 5、1023–1033 (2005)。

記事 CAS Google Scholar

Price、SL 有機結晶構造と多形性の計算による予測。 内部。 Rev. Phys. 化学。 27、541–568 (2008)。

記事 CAS Google Scholar

Holden, JR, Du, Z. & Ammon, HL C-、H-、N-、O-、および F- を含む有機化合物の可能な結晶構造の予測。 J.Comput. 化学。 14、422–437 (1993)。

記事 CAS Google Scholar

van Eijck, BP & Kroon, J. 結晶構造予測のための UPACK プログラム パッケージ: 小さな炭水化物分子の力場と結晶構造の生成。 J.Comput. 化学。 20、799–812 (1999)。

3.0.CO;2-Z" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291096-987X%28199906%2920%3A8%3C799%3A%3AAID-JCC6%3E3.0.CO%3B2-Z" aria-label="Article reference 69" data-doi="10.1002/(SICI)1096-987X(199906)20:83.0.CO;2-Z">論文 PubMed Google Scholar

バス、WR レポート ORNL-5747。 オークリッジ国立研究所、オークリッジ、テネシー州 (1981)。

Jorgensen, WL & Tirado-Rives, J. OPLS [液体シミュレーションの最適化ポテンシャル] タンパク質のポテンシャル関数、環状ペプチドとクランビンの結晶のエネルギー最小化。 混雑する。 化学。 社会 110、1657–1666 (1988)。

論文 CAS PubMed Google Scholar

Van Eijck, BP & Kroon, J. 結晶構造予測における等価構造の高速クラスタリング。 J.Comput. 化学。 18、1036–1042 (1997)。

3.0.CO;2-U" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291096-987X%28199706%2918%3A8%3C1036%3A%3AAID-JCC7%3E3.0.CO%3B2-U" aria-label="Article reference 72" data-doi="10.1002/(SICI)1096-987X(199706)18:83.0.CO;2-U">記事 Google Scholar

Spek、AL プログラム PLATON による単結晶構造の検証。 J.Appl. クリスタロガー。 36、7–13 (2003)。

記事 CAS Google Scholar

アラバマ州スペック 化学結晶学における構造検証。 Acta Crystallogr.、セクション。 D:バイオル。 クリスタロガー。 65、148–155 (2009)。

記事 CAS Google Scholar

Rappe、AM、Rabe、KM、Kaxiras、E.、Joannopoulos、JD 最適化された擬ポテンシャル。 物理学。 Rev. B: 凝縮します。 問題 41、1227 (1990)。

記事 ADS CAS Google Scholar

Becke、AD & Johnson、ER 交換孔双極子モーメントと分散相互作用。 J.Chem. 物理学。 122、154104–(1:5) (2005)。

記事 ADS Google Scholar

Grimme, S.、Ehrlich, S. & Goerigk, L. 分散補正密度汎関数理論における減衰関数の効果。 J.コンプ。 化学。 32、1456–1465 (2011)。

記事 CAS Google Scholar

ジャンノッツィ、P. 他 Quantum ESPRESSO: 材料の量子シミュレーションのためのモジュール式のオープンソース ソフトウェア プロジェクト。 J.Phys. 凝縮します。 Matter 21、395502 http://www.quantum-espresso.org (2009)。

論文 PubMed Google Scholar

ジャンノッツィ、P. 他量子 ESPRESSO による材料モデリングの高度な機能。 J.Phys. 凝縮します。 事項 29、465901 (2017)。

論文 CAS PubMed Google Scholar

東郷 A. & 田中 I. 材料科学におけるフォノン計算の第一原理。 Scr. メーター。 108、1–5 (2015)。

記事 ADS CAS Google Scholar

Kresse, G. & Hafner, J. 液体金属の非経験的分子動力学。 物理学。 Rev. B 47、558–561 (1993)。

記事 ADS CAS Google Scholar

Kresse, G. & Hafner, J. ゲルマニウムにおける液体金属 - アモルファス半導体転移の非経験的分子動力学シミュレーション。 物理学。 Rev. B: 凝縮します。 問題 49、14251–14269 (1994)。

記事 ADS CAS Google Scholar

Kresse, G. & Furthmüller, J. 平面波基底関数を使用した、金属と半導体の非経験的な総エネルギー計算の効率。 計算します。 メーター。 科学。 6、15–50 (1996)。

記事 CAS Google Scholar

Kresse, G. & Furthmüller, J. 平面波基底関数セットを使用した非経験的な総エネルギー計算のための効率的な反復スキーム。 物理学。 Rev. B: 凝縮します。 問題 54、11169–11186 (1996)。

記事 ADS CAS Google Scholar

クレッセ、G. et al. VASP: ウィーンをゼロから作るシミュレーション パッケージ。 http://www.vasp.at (2021)。

Blöchl、PE プロジェクター拡張波法。 物理学。 Rev. B: 凝縮します。 問題 50、17953 ~ 17979 (1994)。

記事 ADS Google Scholar

Kresse, G. & Joubert, D. ウルトラソフト擬似ポテンシャルからプロジェクター拡張波法まで。 物理学。 Rev. B: 凝縮します。 問題 59、1758 ~ 1775 年 (1999)。

記事 ADS CAS Google Scholar

リファレンスをダウンロードする

この研究は、米国陸軍研究所および陸軍研究局 (助成金番号 W911NF-19-1-0117) および NSF (助成金番号 CHE-1900551) の支援を受けました。 原稿に関してコメントをくださった Rafał Podeszwa に感謝します。

デラウェア大学物理天文学部、ニューアーク、デラウェア州、19716、米国

ラーフル・ニハル & クシシュトフ・シャレヴィチ

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

RN と KS がこの方法を設計しました。 RN はそれをコーディングし、数値計算を実行しました。 両著者は結果を分析し、原稿を執筆し、改訂しました。

通信相手はクシシュトフ・シャレヴィチ。

著者らは競合する利害関係を宣言していません。

Nature Communications は、この研究の査読に貢献してくれた Gregory Beran、Graeme Day、およびもう一人の匿名の査読者に感謝します。 査読者レポートが利用可能です。

発行者注記 Springer Nature は、発行された地図および所属機関の管轄権の主張に関して中立を保っています。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Nikhar, R.、Szalewicz, K. 第一原理に基づく信頼性の高い結晶構造の予測。 Nat Commun 13、3095 (2022)。 https://doi.org/10.1038/s41467-022-30692-y

引用をダウンロード

受信日: 2021 年 11 月 17 日

受理日: 2022 年 5 月 10 日

公開日: 2022 年 6 月 2 日

DOI: https://doi.org/10.1038/s41467-022-30692-y

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。