您的当前位置:首页正文

醛类化合物在气相条件下与.OH反应的速率常数的QSPR研究

2022-01-07 来源:步旅网
 _______________________________________________________________________________www.paper.edu.cn

醛类化合物在气相条件下与.OH反应的速率常数的QSPR研究

闫春丽, 陈景文, 高丽娜, 丁光辉

(大连理工大学环境科学与工程系,大连,116024)

摘要:用PM3算法计算的15个理论分子结构描述符,运用偏最小二乘分析,建立了部分醛类化合物在气相条件下与羟基自由基(.OH)反应的相对速率常数(kOH)的定量结构-性质关系(QSPR)模型。QSPR结果表明:影响醛类化合物与.OH反应速率常数的主要因素分别是分子最高占据轨道能(EHOMO),分子最低未占据轨道能(ELUMO),分子总能量醛类化合物的kOH值随EHOMO、ELUMO (TE),以及分子中氧原子最小的负净电荷(qO-(min))。和TE的增大而增大,随qO-(min)增大而减小。

关键词:醛;相对速率常数;羟基自由基;QSPR;PLS

4、(英文)题名、作者姓名及所在单位、摘要、关键词:

Quantum structure-property relationships (QSPRs) on rate constants for the gas-phase

reactions of selected aldehydes with hydroxyl radical

Yan Chunli, Chen Jingwen, Gao Lina, Ding Guanghui

(Department of Environmental Science and Technology, Dalian University of Technology,

Linggong Road 2, Dalian 116024, P. R. China)

Abstract: By the use of partial least squares (PLS) method and 15 molecular structural descriptors computed from PM3 Hamiltonian, a quantitative structure-property relationship model for rate constants of 24 aldehydes reacting with the hydroxyl radical (.OH) in the gas phase was developed. The QSPR results showed that it was mainly the energy of the highest occupied molecular orbital (EHOMO), the energy of the lowest unoccupied molecular orbital (ELUMO), total energy (TE) and the largest negative net atomic charges on a oxygen atom (qO-(min)) that determine the rate constants of aldehydes reacting with 󰂁OH. Increasing EHOMO, ELUMO and TE leads to increase of rate constants. Increasing qO-(min) leads to decrease of the rate constants.

7

_______________________________________________________________________________中国科技论文在线www.paper.edu.cnKeywords: Aldehyde; Rate constants; Hydroxyl radical; QSPR; PLS

5、(正文): 引言

醛类主要来源于汽车尾气、化工、木材加工防腐、吸烟以及大气光化学反应等[1],是大气中的主要污染物之一。这类污染物不仅是一级污染物,还是二级污染物,是光化学烟雾的主要成分。大气中醛类对人的眼睛、皮肤和呼吸道有强烈的刺激作用,甲醛、丙烯醛对动物具有致癌作用[2]。

与羟基自由基(󰂁OH)的反应,是大气中醛类化合物的主要去除途径[3]。因此,该类由于实验化合物与󰂁OH反应的速率常数(kOH)对于该类化合物的环境行为评价非常重要。测定该速率常数需要特殊的实验装置和设备,发展可以预测kOH的理论模型非常重要。定量结构-性质关系(QSPR)是预测有机污染物的环境行为参数、解释有机污染在环境中迁移、转化行为机理的一种重要手段[4]。在QSPR研究中,量子化学计算是获取分子结构描述符的一种重要方法,而且,量子化学参数具有物理化学意义明确、计算方便、参数精确、快速易得等优点[5]。

预测变量的多重共线性问题在有机污染物的QSPR研究中是相当常见的,为克服多重共线性问题,本研究采用偏最小二乘(PLS)回归[6]。PLS是一种线性回归方法。可以这样理解PLS算法:矩阵X和Y分别代表在K维空间和M维空间的N个点,K是矩阵的列数(即模型中的自变量的个数),M是矩阵Y的列数(即模型中的因变量的个数,在QSPR研究中,绝大多数情况下M=1),N则是矩阵X和Y的行数,即所研究的化合物的个数。PLS的目的就是寻求这两个多为空间里的点所构成的两个超平面之间的关系。目标最大限度地表征X和Y矩阵,同时使矩阵X和Y之间的相关关系最大。

1. 材料和方法

本研究共包括24个醛类化合物(见表1),醛类化合物与·OH反应的速率常数的实测值来自Klamat[7]的工作。

采用CS ChemOffice (2000)软件中半经验分子轨道MOPAC(2000)的PM3算法[8,9],计算24个醛类化合物的量子化学参数,立体优化判据GNORM设为0.1。一共选取15个分子结构描述符,包括:分子量(Mw)、平均分子极化率(α)、偶极矩(µ)、分子生成热

7

_______________________________________________________________________________中国科技论文在线www.paper.edu.cn(∆Hf)、分子最高占据轨道能(EHOMO)、分分子总能量子最低未占据轨道能(ELUMO)、(TE)、分子总电子能(EE)、分子总的核-核排斥能(CCR,CCR=TE-EE)、分子中氢分子中原子的最大的原子净正电荷(qH+)、

表1. 醛类化合物与羟基反应速率常数Table 1. Rate constants for the reaction

between Aldehydes and ·OH

logkOH

No.化合物 实测值 预测值残差a

1甲醛 0.990 1.033 -0.043

碳原子最小的负净电荷(qC-(min))、分子中

2乙醛 1.178 1.287 -0.1093正丙醛 1.292 1.278 0.014氧原子最小的负净电荷(qO-(min))以及前线

4乙醇醛 1.000 0.971 0.029

分子轨道能的三种组合形式ELUMO-

52-氯乙醛 0.490 0.726 -0.236

0.378 0.460 -0.082EHOMO、ELUMO+EHOMO、(ELUMO-EHOMO)2。62,2-二氯乙醛

72,2,2-三氯乙醛 0.179 0.148 0.031

前人研究表明,ELUMO-EHOMO和ELUMO +

82-氟-2-氯乙醛 0.318 0.298 0.020

EHOMO分别与分子的绝对硬度和绝对电负92-氟-2,2-二氯乙醛0.079 -0.118 0.197

102,2-氟-2-氯乙醛 -0.092 -0.155 0.063

性[10]有关。这些参数的值列于表 2中,

112,2-二氟乙醛 0.188 0.277 -0.089

表2的序号和表1的一致。其中,生成热122,2,2-三氟乙醛 -0.222 -0.120 -0.102

13正丁醛 1.371 1.352 0.019

的单位是(kcal),能量的单位是电子伏特

142-甲基-1-丙醛 1.420 1.304 0.116

(eV), 电荷的单位是原子电荷单位(a.c.u),15正戊醛 1.455 1.414 0.041

163-甲基-1-丁醛 1.438 1.444 -0.006

极化率的单位是原子单位(a.u),偶极矩的

17新戊醛 1.423 1.328 0.095

单位是德拜(Debye)。 18苯甲醛 1.111 1.394 -0.283

19乙二醛 1.107 1.238 -0.131

应用Simca-S(6.0版)软件进行PLS

20甲基乙二醛 1.235 1.320 -0.085

分析。Simca-S的计算条件为:交叉验证211,5-戊二醛 1.377 1.240 0.137

22丙烯醛 1.299 1.248 0.051

次数=7,最大迭代次数=200,显著性水平

232-丁烯醛 1.556 1.387 0.169

限(p)=0.05。采用交叉验证的方法,确定24异丁烯醛 1.444 1.262 0.182

a: 残差=logkOH(实测)- logkOH (预测) PLS主成分的个数(A)。所谓交叉验证方

法, 就是在建立模型前, 从样本中剔除一定比例的化合物, 然后利用剩余化合物所建立的模型来预测所剔除的化合物的Y值,此过程反复多次, 保证每一个化合物都曾被剔除出模型一次, 并只能一次。 在此基础上, 计算预测误差平方和(PRESS):

ˆ)2PRESS=∑∑(Yim−Yim

i

m

(1)

ˆ代表因变量的预测值;i代表不同的观测值,m代表这里Yim表示因变量的实测值,Yim不同的因变量(本研究中m=1)。在此基础上,计算得到Q2cum:

7

_______________________________________________________________________________中国科技论文在线www.paper.edu.cn Q2cum = 1.0 − ∏(PRESS/SS)a, a = 1, 2, …k. (2) 这里SS是前一个维度下的残差平方和. ∏(PRESS/SS)a表示各个PLS主成分的PRESS/SS值的乘积。 因此, 可以看出,Q2cum表征模型的预测能力和稳健程度,Q2cum值越大,所得出的PLS模型越显著,预测能力越强。当Q2cum >0.5时,可以认为所建立的模型有较拟合值和实测值的相关系数(R)、好的预测能力。本研究采用PLS主成分个数(A)、Q2cum、显著性水平(P)以及总的标准误差(SE)来表征模型的优劣。SE定义为:

SE=

∑[logk

i=1

n

OH

(实测值)i−logkOH(预测值)i]2

n−A−1

(3)

其中n代表训练集中化合物的数目。

表2. 醛类化合物的量子化学参数

Table 2. Theoretical molecular structural descriptors of aldehydes under study.

No. ∆Hf TE EE CCRMwEHOMOELUMOqC-(min)qO-(min) qH+ µ α1 -34.10 -442.71 -834.62 391.91 30.03 -10.63 0.83 -0.31 0.01 2.16 9.92 2 -44.23 -592.45 -1486.04 893.58 44.05 -10.71 0.82 -0.20 -0.32 0.07 2.54 17.52 3 -48.63 -741.95 -2284.44 1542.49 58.08 -10.59 0.86 -0.17 -0.31 0.07 2.48 24.68 4 -83.44 -886.08 -2433.99 1547.9160.05 -10.72 0.50 -0.01 -0.31 0.07 2.26 20.86 5 -44.99 -893.61 -2312.55 1418.94 78.50 -10.48 0.51 -0.18 -0.28 0.08 3.09 24.54 6 -48.00 -1194.86 -3265.76 2070.91 112.94 -10.73 -0.15 -0.20 -0.27 0.11 1.36 33.18 7 -51.94 -1496.15 -4416.43 2920.28 147.39 -10.82 -0.39 -0.25 -0.25 0.08 1.60 43.20 8 -87.18 -1318.44 -3439.13 2120.69 96.49 -10.95 -0.35 -0.02 -0.26 0.10 0.83 26.64 9 -92.15 -1619.77 -4589.58 2969.80 130.93 -11.16 -0.59 -0.04 -0.24 0.09 2.15 36.77 10 -138.84 -1743.68 -4791.49 3047.80 114.48 -11.36 -0.79 -0.23 0.09 1.99 28.35 11 -132.48 -1442.29 -3643.62 2201.33 80.03 -11.33 -0.02 -0.25 0.08 2.16 18.39 12 -190.47 -1867.81 -5011.42 3143.61 98.03 -11.88 -0.51 -0.22 0.09 2.17 18.79 13 -54.13 -891.50 -3162.96 2271.47 72.11 -10.60 0.85 -0.18 -0.31 0.07 2.46 31.72 14 -54.05 -891.49 -3220.56 2329.07 72.11 -10.51 0.87 -0.15 -0.31 0.08 2.45 31.44 15 -59.52 -1041.03 -4123.86 3082.82 86.13 -10.60 0.85 -0.18 -0.31 0.07 2.45 38.75 16 -59.04 -1041.01 -4242.11 3201.10 86.13 -10.57 0.86 -0.18 -0.31 0.08 2.40 38.25 17 -59.90 -1041.05 -4323.12 3282.07 86.13 -10.47 0.88 -0.12 -0.31 0.05 2.42 38.0218 -18.55 -1364.51 -6236.05 4871.53 120.15 -10.01 -0.36 -0.17 -0.32 0.12 2.81 65.19 19 -74.01 -1004.31 -2982.97 1978.66 72.06 -10.67 0.44 -0.27 -0.31 0.10 2.88 27.29 20 -83.08 -1154.01 -3976.41 2822.40 86.09 -10.82 0.34 -0.25 -0.31 0.10 2.01 34.44 21 -83.88 -1303.35 -4964.39 3661.04 100.12 -10.55 0.76 -0.18 -0.31 0.07 4.74 41.49 22 -17.91 -709.95 -1992.83 1282.87 56.06 -10.68 -0.10 -0.26 -0.32 0.11 2.37 25.75 23 -28.77 -859.73 -2814.98 1955.25 70.09 -10.42 -0.09 -0.28 -0.33 0.11 2.60 35.17 24 -27.78 -859.69 -2868.99 2009.30 70.09 -10.46 -0.05 -0.23 -0.32 0.09 2.47 33.48

7

_______________________________________________________________________________中国科技论文在线www.paper.edu.cn2. 结果和讨论

2.01.6logkOH(实测值) 在PLS模型中,VIP是一个反映预测变量在模型中重要性的参数。 预测变量的VIP值越大,说明该变量对因变量影响越大。 在PLS分析中,并不是预测变量的个数越多越好,如果在模型中引入多余的或与因变量无关的预测变量,将会增加模型的“背景噪声”,降低模型的可靠性

[11]

1.20.80.40.0-0.4-0.50.00.51.0 1.5 2.0logkOH(预测值) 图1. logkOH的实测值与观察值相关图 Fig.1. Plot of observed and predicted logkOH for Model (1)。本研究尝

试在PLS分析中剔除VIP最小的分子结构参数的方法,获取最优的PLS模型。依此方法,依次剔除上一次PLS模型中VIP值最小的分子结构参数, 然后进行新的PLS分析,一直持续到只剩下两个分子结构参数。采用这个计算程序,基于初始的15个分子结构描述符,对24个醛类化合物的kOH进行PLS分析,一共可以得到14个PLS模型,最后选取Q2cum值最大的一个模型为最优模型,称为模型(1)。该模型的结果列于表3中。在表3,R2Xadj(cum)与 R2Yadj(cum)分别表示所有提取的PLS主成分所能解释的自变量和因变量的总方差的比例,t代表预测变量的数目。从表3中可以看出,在模型(1)中包括14个预测变量,共提取了4个主成分,这4个主成分解释了自变量总方差的85.0%,因变量总方差的94.4%。

模型(1)的Q2(cum)值在0.9以上,表明模型(1)具有较高的预测能力和稳健度。从图1可以看出,模型(1)的预测值与实测值比较接近,预测值与实测值具有较好的相关性(R =

表3. 模型 (1) 的拟合结果 Table 3. Model fitting results

Model

R2Xadj(cum) t A

R2Yadj(cum)

Q2(cum)

R P SE

0.944 0.901 0.977 3.36×10-16 0.136

(1) 14 4 0.850

7

_______________________________________________________________________________中国科技论文在线www.paper.edu.cn

0.977,P<0.001)。因此,模型(1)可以用于其它醛类化合物与󰂁OH反应速率常数的预测。基于非标准化的系数和常数项,可以得到类似于经多元回归分析所得到的QSPR方程:

logkOH = -9.58 qO-(min) + 2.39×10-2(ELUMO+EHOMO) +

1.86×10-2 EHOMO + 2.24×10-4 TE + 4.21×10-2ELUMO-4.26×10-4∆Hf-7.57×10-3 Mw-9.91×10-1qC-(min)-3.22×10-2µ-5.60×10-5EE +7.41×10-3α + 1.96×10-3(ELUMO-EHOMO)2 + 4.33×10-2( ELUMO-EHOMO) + 1.23×10-4CCR-2.08 (4) VIP是一个反映自变量在模型中重要性的参数,VIP值大于1,表示自变量对于因变量具有很大的影响。模型(1)中各个自变量的VIP值列于表 4 中。观察表4,可以得到如下结论:(1) 参数

qO-(min)、ELUMO+EHOMO、EHOMO、

表 4. 模型 (1) 中各参数

的VIP值 Table 4. VIPs for Model (1) 预测变量 qO-(min) ELUMO+EHOMO EHOMO TE ELUMO

VIP1.5861.3621.2511.1751.1731.1030.9640.9460.8160.6280.564

ΔHf

Mw qC-(min) µ EE α

TE 和ELUMO是决定醛类化合物的kOH值大小的主要因素。(2) 醛类化合物的kOH值随qO-(min)的增大而减小,随ELUMO+EHOMO、EHOMO、TE 和 ELUMO的增大而增大。

(ELUMO-EHOMO)2 0.556ELUMO-EHOMO 0.544

0531CCR

而ELUMO则可以作为分子接受电子能力的量度。EHOMO可以作为分子给电子能力的量度,

由于󰂁OH是亲电基团,EHOMO和ELUMO 越大,醛分子给电子的能力越强,则󰂁OH越容易进攻醛分子,反应就加快。参数ELUMO+EHOMO和分子的绝对电负性有关,绝对电负性可以定义为-1/2(ELUMO+EHOMO)[10],EHOMO和ELUMO具有正的相关性,EHOMO+ELUMO越大,EHOMO也越大,和󰂁OH反应也就加快。从VIP值可以看出qO-(min)对模型的影响最大,它是醛基(-CHO)上氧原子的最负电荷,qO-(min)越大,醛分子中-CHO基团上的电子云密度󰂁OH越不容易进攻-CHO。研究表明,在低温状态下(295-550 K),󰂁OH可以从-CHO越小,

基团上抽取H原子[12]。因此,qO-(min)越大,󰂁OH从-CHO上抽取H原子的可能性越小,醛分子和 󰂁OH的反应速率就减小。 3. 结论

在本研究中,用PM3算法计算的15个理论分子结构描述符,运用偏最小二乘分析,

7

_______________________________________________________________________________中国科技论文在线www.paper.edu.cn

建立了部分醛类化合物在气相条件下与󰂁OH反应的相对速率常数的QSPR模型。结果表明EHOMO、ELUMO、TE和qO-(min))是影响醛类化合物的kOH值大小的主要分子结构因素。ELUMO 和TE较大的醛类化合物,其kOH值比较大,qO-(min)比较大的醛类化合物,EHOMO、

其kOH值比较小。

6、参考文献:

[1] 完莉莉,汪玉庭. 室内空气污染的研究现状. 环境监测管理与技术,2001,13(2): 12-16. [2] Collins J. J., Ness R., Tyl R. W. et al. A review of adverse pregnancy outcomes and

formaldehyde exposure in human and animal studies. Regulatory Toxicology and Pharmacology, 2001, 34(2): 17-34.

[3] Atkinson R. Atmospheric chemistry of VOCs and NOx. Atmos. Environ., 2000, 34(12-14):

2063-2101.

[4] 陈景文. 有机污染物定量结构-性质关系与定量结构-活性关系[M]. 大连:大连理工

大学出版社, 999:1-8.

[5] Karelson M., Lobanov V.S., Katritzky A.R. Quantum-chemical descriptors in

QSAR/QSPR studies. Chem. Rev., 1996, 96(29): 1027-1043.

[6] Söström M., Wold S. A multivariate calibration problem in analytical chemistry solved by

partial least squares in latent variables [J]. Anal. Chim. Acta., 1983, 150(1): 61-70. [7] Klamat A. Estimation of gas-phase hydroxyl radical rate constants of oxygenated

compounds based on molecular orbital calculations. Chemosphere, 1996, 32(4): 717-726. [8] Stewart J. J. P. Optimization of parameters for semiempirical methods I. Method [J]. J.

Comp. Chem., 1989, 10(2): 209-220.

[9] Stewart J. J. P. Optimization of parameters for semiempirical methods II. Applications [J].

J Comp Chem, 1989, 10(2): 221-264.

[10] Pearson P. G. Absolute electronegativity and hardness correlated with molecular orbital

theory. Proc. Natl. Acad. Sci., 1986, 83: 8440-8441.

[11] Lazraq A., Cleroux R., Gauchi J-P. Selecting both latent and explanatory variables in the

PLS1 regression model. Chemom. Intell. Lab. Syst., 2003, 66(2): 117-126.

[12] Taylor P. H., Rahman M. S., Arif M., et al. Kinetic and mechanistic studies of the

reaction of hydroxyl radicals with acetaldehyde over an extended temperature range. Symposium (international) on Combustion, 1996, 1(7-8): 497-504.

7

_______________________________________________________________________________中国科技论文在线www.paper.edu.cn

7、资助类别:省部级课题

8、资助来源:高等学校优秀青年教师教学和科研奖励基金

9、课题名称及编号: 醛类化合物在气相条件下与.OH反应的速率常数的QSPR研究

7

因篇幅问题不能全部显示,请点此查看更多更全内容