本文发布在微信公众号 Wiley生态学,https://mp.weixin.qq.com/s/2xFvc3StgCZqsp0PM1f5zw
文献导读:
为揭示研究对象对环境因子的响应,特别是对多个存在互作的环境因子的非线性响应,我们通常要设计存在一定重复或者梯度的生态学实验。而在设计实验时,要不要设置重复,怎样设置重复,是我们首先要面对和解决的问题,也是大家非常关心的问题。2018年Juergen Kreyling在Ecology Letters上通过模型模拟和实验检验提出了“牺牲重复来增加因子水平可以达到更好的预测效果”的观点;2019年David Chalcraft发文评论认为前文对模型预测能力评价上存在的问题导致了对重复的重要性揭示不足。
原文信息:
正方:
反方:
正文:
正方观点:是否设置重复,这是一个需要考量的问题,在面对多因子互作的非线性响应时,牺牲重复数来达到环境因子水平的最大化(梯度实验)可以提高模型的预测能力
正方论据1:理论上,在实验单元总数一定的情况下,相比梯度设计,重复设计没有反映响应面的潜力(图1)。
图1 在实验单元总数相同下,重复设计(Replicated design)和梯度设计(Gradient design)的区别示意图
正方论据2:模型模拟显示,不同随机噪音和响应面下,减少重复数(i.e.增加因子水平)均可以增强模型的解释度(图2)。
图2 实验单元数在不同随机性和响应面下与模型解释度的关系
正方论据3:在土壤呼吸响应碳氮添加和纤毛虫细胞形状响应温度养分变化这两个真实实验中,梯度设计的模型预测能力优于重复设计(结果类似模型模拟,故图略;详见原文)
反方观点:是否设置重复,这不应该是一个问题,正方的预测能力评价存在不足,重复对于模型的预测能力、解释度和统计学显著性、失拟检验等都具有不可忽视的意义
反方论据1:在模型分析中,正方通过预测值和真实值之间的回归分析得出的R2来进行预测能力评价,但实际上只有在斜率为1且截距为0时这种评价才有效,随机取样会导致预测值和真实值之间存在不同的线性关系(图3),因此评价模型预测能力也要评价预测值和真实值之间的线性参数。
图3 随机取样会导致预测值偏离真实值,真实关系为实线。图(a)是预测模型,也称响应面,可以是更为复杂的关系;图(b)是预测评价模型,是线性关系
反方论据2:模型模拟显示,对于线性和二次方关系的响应面,带有重复的实验设计可以增加参数的一致性和模型的解释度,同时也增加了预测值和真实值之间线性回归的一致性(斜率、截距对于1、0的偏离程度,图表详见原文补充材料)。在多因子实验中,如果包含二次方响应关系的因子,带有重复的设计也可以增加参数的一致性。
反方论据3:不同于前面简单的单因子分析,在正方的多因子响应回归模型中,梯度设计和重复设计产生的模型具有相同的预测能力(预测值-真实值线性回归参数变异无差异),但是在环境因子存在交互时,重复设计产生的模型具有更小的p值和更大的R2,因此梯度设计得出的预测模型更容易被忽视。
反方论据4:带有重复的实验设计,可以用ANOVA对回归模型进行失拟检验。
小编总结:在实验设计时,处理水平和重复数存在一定的权衡关系。Kreyling等的研究表明在一定情况下不带重复的纯粹梯度实验是合理且高效的,强调梯度设计的可用性;而Chalcraft则提醒我们不带有重复的实验设计是存在风险的(比如单因素响应面),且付出了难以进行失拟检验的代价,强调重复的重要性。
本期编辑:
刘乐乐 | 山东大学, 博士在读
研究方向:分子生态学、入侵生态学