作者简介:朱利兰(1981—),广东轻工职业技术学院讲师. 研究方向:体育运动学. E-mail: zhulilan_8983@sina.com
中文责编:晨 兮; 英文责编:新 谷
1)广东轻工职业技术学院体育部,广东广州 510300; 2)徐州工程学院材料与化学工程学院,江苏徐州 221018
1)Department of Physical Education, Guangdong Industry Polytechnic, Guangzhou 510300, Guangdong Province, P.R.China;2)School of Material and Chemical Engineering, Xuzhou University of Technology, Xuzhou 221018, Jiangsu Province, P.R.China
computational chemistry; benzodiazepinooxazole derivative; male mice; anti-fighting activity; molecular electronegativity distance vector; artificial neural network(ANN); quantitative structure-activity relationship(QSAR)
DOI: 10.3724/SP.J.1249.2021.03295
抗搏击训练就是增粗肌肉纤维,强化肌肉腱结构,通过强大的腹肌和腹部外侧肌保护腹内脏器,使运动员表现出优异的抗搏击能力. 但是研究发现,给小鼠服用某些药物也能提高其抗搏击能力,即通过服用药物可以提高运动员的抗搏击能力,这种行为势必给拳击等身体接触类比赛带来不公正. 因此,研究药物分子微观结构和药物对抗搏击能力的影响机理也是国际反兴奋剂斗争的一项新内容.
物质定量构效关系(quantitative structure-activity relationship, QSAR)[1-11]是依据表征分子结构的描述符,运用各种数学统计方法建立定量描述物质生物活性的数学模型,进而探讨影响生物活性的结构因素,并推测发挥生物作用的微观机理.本研究基于QSAR方法建立小鼠抗搏击能力[12]的回归模型,将此模型中的自变量作为输入层,并建立逆传播(back-propagation, BP)算法[13-18]模型,以揭示影响抗搏击活性的微观结构,探讨其抗搏击作用的微观机理,为兴奋剂检测技术提供理论依据.
实验选用体质量为20~25 g的雄性小鼠,所用30种苯二氮艹卓恶唑衍生物分子[12]的基本结构见图1,其中,R1、R2、R3、R4、R5和R6为取代基. 30种衍生物分子结构与抗搏击活性见表1,其中,tr、va和te分别为训练集、验证集和测试集.
将上述30种化合物分别以悬浮液形式溶于含有0.5%(质量分数)黄蓍胶的0.85%(质量分数)盐水中,口服给药后,对小鼠的脚实施电击1 h后,测量没有战斗行为能力的小鼠所需苯二氮艹卓恶唑的浓度. ED50为半数小鼠丧失搏击能力所需苯二氮艹卓恶唑的浓度(单位:mol/L). 根据物理化学的平衡原理,化学反应的自由能改变(ΔGr)与浓度为对数关系. 因此,对ED50取负对数即E =-lg(ED50)用于建模,称为抗搏击活性[12].
QSAR的关键是对抽象的分子结构数值化表征,即建立描述分子结构的变量,常用方法是拓扑指数和量化参数等. LIU等[19-21]基于几种著名拓扑的局限,提出能全面显示拓扑、几何和电学特性的电性距离矢量的模(MD, D=1,2,…,91)的计算方法. 利用Matlab程序计算30种苯二氮艹卓恶唑类药物分子的MD, 其中, M10、 M16和 M59分别为第10、16和59个电性距离矢量的模.
30种苯二氮艹卓恶唑类药物分子的MD为自变量,小鼠抗搏击活性E为因变量,采用逐步回归(stepwise regression, SWR)程序进行回归分析,并建立QSAR模型. 用方差变异因子(VIF)[22]估计模型中变量间的相关性.当VIF≤5.0模型是稳定的,自变量间的共线性低; 当VIF>5.0时,模型不稳定. 另外,回归模型的质量还用判定系数R2(削减误差比率)和交叉验证系数(R2cv)予以评价. 文献[23]认为,作为经验法则,判定系数R2>0.80和R2cv>0.50的方程是合理的.
通过Akaike的信息准则(AIC, 产生最小AIC值的模型被认为可能是最有用的)和Kubinyi函数(FIT, 最佳模型将呈现该函数的最高值)确定是否应该在模型中包含某个变量. 也就是说,如果增加一个变量时Akaike的信息准则的值降低,而Kubinyi函数的值增加,则认为这个新变量的引入是合理的[24-25].
目前,应用最为广泛的人工神经网络(artificial neural network, ANN)是基于BP算法[13-18]的3层神经网络. 其中,输入层接受外界数据输入,隐含层对输入数据进行处理和转换,输出层则产生输出(即预测)结果. 网络中的每层都包含若干神经元,输入层和输出层的神经元数由模型中的变量数决定,隐含层神经元数则可通过试算或规则确定.
采用SWR方法建立E与MD的最佳QSAR模型,结果如表2. 其中, S和F分别为估计标准误差和Fisher统计值, R2adj为校正后判定系数.
表2显示,随着模型自变量数的增加,所有衡量模型质量的统计指标均有规律变化,没有出现转折点,因此,不能根据这些指标确定最佳QSAR模型. 但是,模型中各个自变量的方差变异因子(VIF)存在转折点:三元模型中M59、 M16和M10的VIF依次为1.181、1.133和1.074,四元模型中M59、M16、M10和M36的VIF依次为1.378、11.384、1.413和10.515. 在四元模型中出现VIF>5.0, 说明该回归方程存在严重的共线性,模型不稳定. 而三元模型的VIF非常接近1,说明这3个自变量之间几乎不相关,具有良好的稳定性,故建立三元方程为
QSAR模型预测能力的验证最常用的方法之一是交叉验证. 模型(1)的R2cv=0.727>0.5, R2=0.799, 表明该模型良好的预测能力和拟合性. 模型(1)给出E预测值,其中, Eexp、 Ecal1和Ecal2分别为抗搏击活性的实验值、模型(1)的计算值和神经网络模型计算值,与实验数据基本吻合(表1).
表2 电性距离矢量(MD)和抗搏击活性(E)的逐步回归结果
Table 2 The results of E and MD with SWR
模型(1)虽然符合一般建模要求,但与YOSHIMOTO等[12]给出五元回归方程的R=0.934(R2=0.872, S=0.170)比较,相关性稍差. 因此,本研究在线性模型(1)的基础上采用BP神经网络方法建立非线性方程,以提高拟合水平.
为避免所建神经网络模型过拟合、过训练,根据许禄等[18]的建议规则寻找最佳隐含层的单元数(H), 即N/M≥1, 其中, N和M分别是样本数和网络总权重.
M=(I+1)H+(H+1)Q(2)
其中, I、 H和Q分别是输入层、隐含层和输出层的单元数. 本研究中,I=3(M59、M16、M10),Q=1(E)及N=30, 取N/M=1.1可得H=5.25. 因此,采用输入层:隐含层:输出层=3:5:1的网络结构建立模型. 为避免过拟合、过训练,将数据集分为训练集、验证集和测试集3组,各集化合物数依次为18、6和6. 所设验证集的目的是监控训练过程,即当验证集误差开始上升便自动停止训练,以防网络的过训练、过拟合,并可减少训练时间. 由此建立的模型为: 训练集的R2=0.979, 总体的R2总=0.984, 二者非常接近,说明所建模型是稳定的,不存在过训练、过拟合现象. 该模型的估计标准误差S=0.054, 给出的预测值(见表1的Ecal2)与实验值非常吻合. 所建BP-E模型明显优于文献[12]的研究结果.
BP- E模型的R2=0.984>0.8, R2为削减误差比例,表明M59、 M16、 M10与E有良好的非线性关系.因此,可认为BP- E模型揭示了影响小鼠抗搏击能力E的98.4%因素,只有1.6%的随机因素未被揭示. 结合电性距离矢量理论:M59对应—NH—和—OH(O=); M16对应—CH2—和; M10对应—CH3和—O—等结构基团. 可见,影响苯二氮艹卓恶唑类药物对小鼠抗搏击能力E的微观结构主要是—CH3、—CH2—、、—NH— 和—OH(O=). 前3种是非极性基团,后2种是高电负性极性基团. 因此,前者可与小鼠体内靶标蛋白发生疏水作用,后者与靶标蛋白形成氢键及配位键.
1)采用最佳子集变量回归方法,建立了苯二氮艹卓恶唑类药物对小鼠抗搏击能力E的最优三元QSAR模型. 通过统计指标R2、R2cv和VIF检验,表明QSAR模型具有良好的相关性,具有较强的稳定性和预测能力.
2)以M59、 M16和M10为输入变量建立BP-E模型的相关性(R2=0.984, S=0.054)明显优于YOSHIMOTO等[12]的五元回归方程的相关性(R2=0.872, S=0.170). 模型中的M59、 M16、 M10与E之间存在良好的非线性关系,而非简单的线性关系.
3)根据模型(1)的电性距离矢量M59、 M16和M10的值, 结合R2=0.984, 表明微观结构—CH3、—CH2—、、—NH—和—OH(O=)是影响E的主要因素.
4)根据影响E的药物分子微观结构可知,苯二氮艹卓恶唑类药物分子与小鼠体内靶标酶的作用力主要是氢键、配位及疏水作用.
研究揭示了影响小鼠抗搏击能力的微观分子结构及作用机理,可为世界兴奋剂检测技术提供理论参考.
深圳大学学报理工版
JOURNAL OF SHENZHEN UNIVERSITY SCIENCE AND ENGINEERING
(1984年创刊 双月刊)
主 管 深圳大学
主 办 深圳大学
编辑出版 深圳大学学报理工版编辑部
主 编 李清泉
国内发行 深圳市邮电局
国外发行 中国国际图书贸易集团有限公司(北京399信箱)
地 址 北京东黄城根北街16号
邮 编 100717
电 话 0755-26732266
0755-26538306
Email journal@szu.edu.cn
标准刊号 ISSN 1000-2618
CN 44-1401/N