【1091】混杂因素与交互作用杂谈!
缘起 统计学在科学研究中的最大的贡献,其实就是对误差的控制。在控制相关因素导致的误差之后,我们才能得到的事物背后的必然规律。 在统计学的研究中,我们经常听说混杂因素和交互作用,今天就带大家认识一下混杂与交互!
1.混杂因素
混杂因素(confouding)是指能同时导致研究因素和研究疾病,若在比较的人组中分布不均衡,可以夸大或者缩小研究因素与疾病之间真实的联系的因素。
混杂模式图
混杂因素的条件:
①必须是所研究疾病的独立危险因子;②必须与研究因素(暴露因素)有关;③一定不是研究因素与研究疾病因果链上的中间变量。
2.交互作用
交互作用(interaction)是指一个因素各个水平之间反应量的差异随其他因素的不同水平而发生变化的现象。它的存在说明同时研究的若干因素的效应非独立。交互作用的效应可度量一个因素不同水平的效应变化依赖于另一个或几个因素的水平的程度。
交互作用模式图
3.统计分析
(1)从统计学的角度来看,假设我们先建立一个简单线性回归模型:E(Y) = β0+β1X1 (2)如果探讨变量X2是否是混杂因素,我们将变量X2作为一个新的自变量带入上面的线性模型:E(Y) = β0+β1X1+β2X2 【如果β2回归系数有意义,说明X2是一个独立的混杂因素】
(3)统计学角度来看,我们建立一个仅有两个自变量的线性回归模型:E(Y) = β0+β1X1+β2X2+β3X1X2
【如果β3回归系数有意义,说明X1X2存在交互作用。】
4.松哥漫谈
存在混杂那就发现了独立的风险因子,对于科学研究来说,已经有一定的价值。而如果发现交互作用,那也称为发现了效应修饰因子,对于科学研究来说,价值更大。
正如你抓住了小偷,是不是已经很不错了;但是如果你还挖出了同伙,那价值是不是更大啦!
所以对于发表高分论文的研究者而言,当您确定某个独立的风险因素之后,基于专业应该对可能因素进行交互作用分析。将极大提高论文的价值。
如果发现有交互,但不能仅仅报告有交互作用叫了事,还要进一步的进行分层分析,以确定在研究因素的不同层中,该因素的作用大小。
对于混杂因素的控制:在设计阶段可以进行限制、匹配和随机化。在统计分析阶段,可以分层分析、多因素调整分析、倾向性评分分析、工具变量分析等。
对于交互作用的分析:常用多因素分析验证其交互作用的存在,然后分进行分层分析,进行层间效应分析。
还需要注意一点:对于某个因素,必须首先是混杂因素,才能考虑交互作用才为合理。
------------------------------
-
conf--统计思维与理论系列---
【1090.】中英文期刊分类(SCI分区和中文核心),一文秒懂!
【1089.】看懂此图,统计开悟!松哥荐读
【1088.】模型发现有交互作用怎么办?怎么解释呢!
【1087.】LASSO:变量选择利器!
【1086.】为啥20分以上SCI论文如此钟情P-interaction!
【1085.】正态性不符合怎么办?其实没啥大事!
【1084.】哎呦妈呀!几何均数还有标准差呀?书中从来没说过呀!
【1083.】交叉验证是啥个意思,是游戏吗?
【1082.】不懂统计思维的统计是没有灵魂的!
【1081.】大识别,这种假都敢造!
【1080.】辨析丨啥?统计上还有q值,和P值啥关系?
【1079.】这种方式,您能识别吗?
【1078.】SCI相关分析比中文正规的3点理由
【1077.】临床科研设计与数据分析9大易忽视错误(推荐)
【1076.】这种套路可以学,怎么化无意义为有意义!
【1075.】很有意思的一个统计问题,并发症到底该如何分析?
【1074.】一文了解主流统计软件
【1073.】WHAT!计算机随机序列竟然是伪随机
【1072.】单因素Logistic回归变量筛选,你还在用表表达,看看人家如何可视化的,审稿人看了能不开心吗?
【1071.】SCI论文中回归模型样本量确定标准,建议阅读
【1070.】性别和吸烟是专业公认的危险因素,为啥多因素分析性别没意义了?
【1069.】数值变量应该以何种形式进入模型
【1068.】多项分类变量进入模型的正确姿势
【1067.】这种随意拆分的错误不能犯
【1066.】SCI统计方法写作秘籍
【1065.】这篇SCI论文10个统计问题辨析
【1064.】以前认为概念无所谓,其实松哥错了
【1063.】松哥,我发现一处SCI统计错误,非常荒谬!
【1062.】分类变量哑变量设置后,参照到底如何选择?
【1061.】这篇SCI的诊断试验结果看不懂,他到底是咋比的
【1060.】如何向统计老师咨询统计问题的正确姿势
【1059.】生存分析单因素筛选的困惑
【1058.】4种最常用的统计设计解读
【1057.】SPSS统计软件学习终身不忘之必杀技
【1056.】回归家族的书剑恩仇录,高手进阶必经之路
【1055.】单因素是危险因素,多因素却保护因素了,想逆天吗?
【1054.】这种文章统计套路您一定要学,不管你什么专业通杀
【1053.】这个空白对照到底要不要加?
【1052.】同一肝癌患者,同时接受CT、超声和磁共振,如何分析?
【1051.】来自临床真实问题,有点意思,松哥荐读!
【1050.】知道两组数据的样本量均数标准差,怎么算合并统计量呢?
【1049.】meta分析软件Revman5.3卡死解决方案
【1048.】P>0.05,本身就是没意义还是样本量不够?
【1047.】两因素方差分析,如何判断哪个因素对结果影响较大?
【1046.】带基线数据数值变量如何进行统计分析辨析
【1045.】统计学习之最大困惑!!
【1044.】松哥为啥我318样本量统计分析出来确实400样本量?
【1043.】这两个是啥图?区别和联系
【1042.】变量之间到底是单项转化还是双向转化
【1041.】统计水平自我评估表
【1040.】基线分析的3个终极目的
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论