集结经典应用案例<br/>用户成功案例解读<br/>分享项目中的实践方案
A classic case
集结经典应用案例
用户成功案例解读
分享项目中的实践方案
03/23
March 23, 2023

MedeA案例25:MedeA在有机分子中的应用


用MedeA对分子性质进行高通量的计算: PM7预测有机分子的振动频率、理想气体熵、热容和吉布斯自由能



1. 研究背景

预测大分子的物理化学性质具有很高的工业价值,但其仍是一项很大的挑战。使用量子化学方法可以确定理想气体的非常准确的热力学性质,包括可以计算流体的热力学性质,蒸汽压力,溶剂化热容量,溶解能,以及确定气相反应的化学反应能量和动力学参数等等。在该文章中,使用密度泛函理论(DFT)和半经验(SE)方法对795个有机分子的热力学性质进行计算,以及对实验和参考DFT数据执行的结果的详细统计分析。


2. 建模及计算方法

在本案例中,作者利用Welcome to MedeA Bundle的简化分子线性输入规范(SMILES)构建分子结构,再用MedeA-MOPAC模块中的半经验PM7的方法对分子进行结构优化,所有的振动频率和计算的热力学性质利用MedeA-MOPAC在刚性转子谐波近似中实现的。


    3.计算结果与讨论

作者通过MedeA-MOPAC模块对52个有机分子的振动频率计算并且和实验值进行比较(图1),从图1可以看出来在2500cm-1以下的振动频率的计算值和实验值拟合的非常理想。


c3031ad9efb557cb6b0333743327f246.png

图1 对于52个有机分子在2500cm-1以下振动频率的计算值和实验值的对比((绿色B3LYP/TZVP ,黑色BP86/TZVP, 红色PM7)


为了更好的评估计算值和实验值的的分布偏差,作者作者通过MedeA-MOPAC模块计算出的平均相对误差(ARDs)和均方根误差(RMSD)进行结果的说明,结果可见表1。从表1中我们可以看出来,相比于实验数据,PM7的振动频率的RMSD的改变并不大。PM7(U)和PM7(S)在低频和高频处具有相当的RMSD。在高频区,PM7(s)的RMSD比DFT方法的大约4.5,并且略差于PM7(U)。

表1:对于52个有机分子的计算值和实验值对比的ARD和RMSD

9a82b9b9e909185364a79a9a8bf34fea.png


为了核查PM7方法是否可以扩展到其他分子,作者通过MedeA-MOPAC模块评估了795个有机分子的振动频率,其结果可见图2。相比于BP86/TZVP,B3LYP/TZVP 和PM7(S)的ARD(RMSD)分别是0.7(5.0) % 和1.2(12.1) %。


6e723a031d20ebc8620c55bd3b6eb73a.png

图2 对于795个有机分子,与BP86/TZVP相比,计算值(绿色:B3LYP/TZVP蓝色:PM7(S))的振动频率的误差


图3列出了与实验值相比较, MedeA-MOPAC模块计算160个有机分子的四种方法计算的结构优化和频率分析中获得的Cp值误差偏离。从图中可以看出,在大于300K时,不同方法的RMSD都小于1%,在低于300K的时候,误差在2%—4%之间。


aeb589824c6d429e1e1a5ee82359f82e.png

图3 对于160个有机化合物的理想气体的恒压热容Cp的实验值和计算值(绿色B3LYP/TZVP, 黑色 BP86/TZVP、红色 PM7(U)、蓝色 PM7(S))的ARD(实线)以及RMSD(交叉)


对于795个有机分子的熵值的比较可见图4(MedeA-MOPAC模块),图中呈现的是DFT(B3LYP绿色)、半经验(PM7(U)红色和PM7(S)在蓝色)与BP86 / TZVP的比较的ARD(实线)和RMSD(交叉),由图可知,从200K到1000K ,PM7(U)的RMSD从7%降低到5%,PM7(S)的RMSD会比PM7(U)小1%左右。


eaf59ae8f33f064821954d8f61420267.png

图 4  对于795有机分子的理想气体熵, DFT(B3LYP绿色)和半经验(PM7(U)红色和PM7(S)在蓝色)与BP86 / TZVP的比较的ARD(实线)和RMSD(交叉)


作者利用MedeA-MOPAC模块计算了在200K到1000K的795个有机分子的吉布斯自由能的比较(图5),由图可知,PM7(S) 和PM7(U)的RMSD较小,在200K到1000K之间,PM7(s)的计算结果较PM7(U)都小一点。另外,想对于BP86/TZVP来说,在200K—1000K时,PM7半经验方法的ARD 大概从−5 kJ mol−1 到 −12 kJ mol−1


98600a9a16b137df089bf6c4d25e4fbe.png

图 5  对于795有机分子的吉布斯自由能, DFT(B3LYP绿色)和半经验(PM7(U)红色和PM7(S)在蓝色)与BP86 / TZVP的比较的ARD(实线)和RMSD(交叉)

  

    4.总结与展望

在本篇文献中,作者为了验证MedeA-MOPAC中的PM7半经验的方法的准确性,将其和实验值以及DFT的计算值进行对比。利用PM7计算795有机分子在200 K和1000 K之间振动频率和热力学性质即零点能量和理想气体恒压热容,并进行了结果的统计分析。然后对熵值进行计算,发现在300K到1000K时,PM7的误差(RMSD)是4%到5%之间。就吉布斯自由能而言,在300K和1000K时,PM7和DFT计算值相比,RMSD分别是15 kJ.mol-1和30 kJ.mol-1

 

    5.参考文献:

Rozanska X, Stewart J J P, Ungerer P, et al. High-throughput calculations of molecular properties in the MedeA environment: Accuracy of PM7 in predicting vibrational frequencies, ideal gas entropies, heat capacities, and Gibbs free energies of organic molecules[J]. Journal of Chemical & Engineering Data, 2014, 59(10): 3136-3143.


   使用MedeA模块:  

  • Welcome to MedeA Bundle

  • MedeA-MOPAC