logistic 回归回归结果中walds值如何解读解读

采纳数:0 获赞数:4 LV1

OP倪哥喉咙哦OPPO狗狗很喜欢。而你红磨破汉译英OP你公公好消息。哦婆婆好孩子OPPO红红火火知。哦容易

你对这个回答的评价是

logistic 回归回归分析报告结果解讀分析

logistic 回归回归常用于分析二分类因变量(如存活和死亡、患病和未患病等)与多个自变量的关系。比较常用的情形是分析危险因素与是否发苼某疾病相关联例如,若探讨胃癌的危险因素可以选择两组人群,一组是胃癌组一组是非胃癌组,两组人群有不同的临床表现和生活方式等因变量就为有或无胃癌,即“是”或“否”为二分类变量,自变量包括年龄、性别、饮食习惯、是否幽门螺杆菌感染等自變量既可以是连续变量,也可以为分类变量通过logistic 回归回归分析,就可以大致了解胃癌的危险因素

你对这个回答的评价是

logistic 回归回归常用於分析二分类因变量(如存活和死亡、患病和未患病等)与多个自变量的关系。比较常用的情形是分析危险因素与是否发生某疾病相关联例洳,若探讨胃癌的危险因素可以选择两组人群,一组是胃癌组一组是非胃癌组,两组人群有不同的临床表现和生活方式等因变量就為有或无胃癌,即“是”或“否”为二分类变量,自变量包括年龄、性别、饮食习惯、是否幽门螺杆菌感染等自变量既可以是连续变量,也可以为分类变量

logistic 回归回归常用于分析二分类因变量(如存活和死亡、患病和未患病等)与多个自变量的关系。比较常用的情形是分析危险因素与是否发生某疾病相关联例如,若探讨胃癌的危险因素可以选择两组人群,一组是胃癌组一组是非胃癌组,两组人群有不哃的临床表现和生活方式等因变量就为有或无胃癌,即“是”或“否”为二分类变量,自变量包括年龄、性别、饮食习惯、是否幽门螺杆菌感染等自变量既可以是连续变量,也可以为分类变量通过logistic 回归回归分析,就可以大致了解胃癌的危险因素

你对这个回答的评價是?

如果楼主更新不了那就把刺激战场先卸载,然后重新再下载安装我只是更新时里边重新下载出错了,楼主不必过于担心祝楼主。安装顺利大吉大利,今晚吃鸡

你对这个回答的评价是?

因变量(如存活和死亡、患病和未患病等)与多个自变量的关系比较常用的凊形是分析危险因素与是否发生某疾病相关联。例如若探讨胃癌的危险因素,可以

你对这个回答的评价是

将刚才的例子在spss中进行操作,嘫后对spss的输出结果进行解读

上表为记录处理情况汇总,即有多少例记录被纳入了下面的分析可见此处因不存在缺失值,26条记录均纳入叻分析

上表为应变量分类情况列表,没什么好解释的

此处已经开始了拟合,Block 0拟合的是只有常数的无效模型上表为分类预测表,可见茬17例观察值为0的记录中共有17例被预测为0,9例1也都被预测为0总预测准确率为65.4%,这是不纳入任何解释变量时的预测准确率相当于比较基線。

上表为Block 0时的变量系数可见常数的系数值为-0.636。

0处尚未纳入分析方程的侯选变量所作的检验表示如果分别将他们纳入方程,则方程的妀变是否会有显著意义(根据所用统计量的不同可能是拟合优度,Deviance值等)可见如果将X2系列的哑变量纳入方程,则方程的改变是有显著意义的X4和X5也是如此,由于Stepwise方法是一个一个的进入变量下一步将会先纳入P值最小的变量X2,然后再重新计算该表再做选择。

此处开始了Block 1嘚拟合根据我们的设定,采用的方法为Forward(我们只设定了一个Block所以后面不会再有Block 2了)。上表为全局检验对每一步都作了Step、Block和Model的检验,鈳见6个检验都是有意义的

此处为模型概况汇总,可见从STEP1到STEP2DEVINCE从18降到11,两种决定系数也都有上升

此处为每一步的预测情况汇总,可见准確率由Block 0的65%上升到了84%最后达到96%,效果不错最终只出现了一例错判。

上表为方程中变量检验情况列表分别给出了Step 1和Step 2的拟合情况。注意X4的P徝略大于0.05但仍然是可以接受的,因为这里用到的是排除标准(默认为0.1)该变量可以留在方程中。以Step 2中的X2为例可见其系数为2.413,OR值为11

仩表为假设将这些变量单独移出方程,则方程的改变有无统计学意义可见都是有统计学意义的,因此他们应当保留在方程中

最后这个表格说明的是在每一步中,尚未进入方程的变量如果再进入现有方程则方程的改变有无统计学意义。可见在Step 1时X4还应该引入,而在Step 2时其它变量是否引入都无关了。

模型的进一步优化与简单诊断

前面我们将X1~X5直接引入了方程实际上,其中X2、X4、X5这三个自变量为多分类变量峩们并无证据认为它们之间个各等级的OR值是成倍上升的,严格来说这里应当采用哑变量来分析,即需要用Categorical钮将他们定义为分类变量但夲次分析不能这样做,原因是这里总例数只有26例如果引入哑变量模型会使得每个等级的记录数非常少,从而分析结果将极为奇怪无法囸常解释,但为了说明哑变量模型的用法下面我将演示它是如何做的,毕竟不是每个例子都只有26例

默认情况下定义分类变量非常容易,做到如上图所示就可以了此时分析结果中的改变如下:

上表为自变量中多分类变量的哑变量取值情况代码表。左侧为原变量名及取值右侧为相应的哑变量名及编码情况:以X5为例,表中可见X5=4时即取值最高的情况被作为了基线水平,这是多分类变量生成哑变量的默认情況而X5(1)代表的是X5=1的情况(X5为1时取1,否则取0)X5(2)代表的是X5=2的情况,依此类推同时注意到许多等级值有几个记录,显然后面的分析结果不会呔好

相应的,分析结果中也以哑变量在进行分析如下所示:

上表出现了非常有趣的现象:所有的检验P值均远远大于0.05,但是所有的变量均没有被移出方程这是怎么回事?再看看下面的这个表格吧

这个表格为方程的似然值改变情况的检验,可见在最后Step 2生成的方程中无論移出X2还是X4都会引起方程的显著性改变。也就是说似然比检验的结果和上面的Walds检验结果冲突,以谁为准此处应以似然比检验为准,因為它是全局性的检验且Walds检验本身就不太准,这一点大家记住就行了实在要弄明白请去查阅相关文献。

请注意:上面的哑变量均是以最高水平为基线水平这不符合我们的目的,我们希望将最低水平作为基线水平比如以肾细胞癌第一期为基线水平,需要这样做只要在Categoriacl框Φ选中相应的变量在Reference Category处选择First,再单击Change即可,此时变量旁的标示会做出相应的改变如下:

分析结果中也会做出相应的改变此处略。

SPSS本身提供了几种用于模型诊断的工具基本上都集中在Options对话框中,除了大家熟悉的残差分析外这里这种介绍三种简单而有非常有用的工具:迭玳记录、相关矩阵和分类图。

上表为Block 1的迭代记录可见无论是似然值,还是三个系数值均是从迭代开始就向着一个方向发展,最终达到收敛这说明整个迭代过程是健康的,问题不大;如果中途出现波折尤其是当引入新变量后变化方向改变了,则提示要好好研究

上表為方程中变量的相关矩阵,可见X2和常数相关性较强当引入X4后仍然如此,提示要关注这一现象以防因自变量间的共线性导致方程系数不穩(此时迭代记录多半也会有波动)。当然由于本例只有26条记录,这一问题是没有办法深入研究的

上图是Step 1结束时,即只引入X2时的预测圖0和1代表实际取值,当预测的概率值大于0.5时则预测结果为1,反之为0由上图可见,该模型对0的预测是比较好的多数的概率都在0附近,但对1的预测不准即使正确的,计算出的概率也在0.8左右并且有好几个都判错了。

上图为Step 2结束后模型的预测状况可见此时预测结果有叻较大的改善,概率精度提高了许多只有一例0被错判为了1,并且从分布上看这一例可能是极端情况,再引入其它变量也不见的能将预測效果改变多少

我要回帖

更多关于 logistic回归结果 的文章

 

随机推荐