1. logistic回归分析的使用条件是什么
Logit回归分析用于研究X对Y的影响,并且对X的数据类型没有要求,X可以为定类数据(可以做虚拟变量设置),也可以为定量数据,但要求Y必须为定类数据,并且根据Y的选项数,使用相应的数据分析方法。Logit回归分析一般可分为三类,分别是二元logit回归、多分类logit回归、有序logit回归。
二元logit分析用于研究X对于Y的影响关系,其中X通常为定量数据,如果X为定类数据,一般需要做虚拟哑变量处理。Y为二分类定类数据,例如愿意和不愿意、是和否等。数据处理时,如果是定类数据,则首先对它们做虚拟哑变量处理。因变量Y只能包括数字0和1,如果因变量的原始数据不是这样,则需要数据编码,设置成0和1。
在SPSSAU中上传数据后,拖拽分析项选择“二元Logit”方法,将Y定类变量放于上方分析框内,X定类/定量变量放于下方分析框内,点击“开始分析”。可以勾选“保存残差和预测值”将残差和预测值保存起来,用于进一步分析。在分析前,如果X为定类数据,可以考虑使用交叉卡方分析去研究X和Y的关系。如果有多个X变量,可以先对定类的X与Y进行卡方分析,对定量的X与Y进行方差分析(或t检验),先看有没有差异关系,将最终有差异关系的X放入二元Logit回归模型中。
研究影响用户购买某品牌笔记本电脑的因素时,将价格、品牌偏好度、性能作为自变量,而将是否购买某品牌笔记本电脑作为因变量进行二元Logit回归分析。从分析结果可以得知,价格、性能会对是否购买某品牌笔记本电脑产生显著的正向影响关系,而品牌偏好度并不会对是否购买某品牌笔记本电脑产生影响关系。
多分类logit分析用于因变量Y有多个选项,并且各个选项之间不具有对比意义的情况,例如,1代表“黑龙江省”,2代表“云南省”,3代表“四川省”,4代表“陕西省”,数值仅代表不同类别。数据要求与处理时,如果因变量Y的类别个数很多,建议进行组合下,尽量减少类别数量。定类数据需做虚拟哑变量处理。
有序logit分析用于因变量Y有多个选项,并且各个选项之间具有对比意义的情况,例如:1代表不满意,2代表一般,3代表满意。分析时首先进行模型平行性检验,如果通过平行性检验,则继续进行分析。
总结,Logit回归分析适用于研究定类数据对定类数据的影响,具体使用哪种Logit回归方法,需根据因变量Y的选项数来确定。在分析前,需确保数据的正确处理和初步分析,以确保模型的有效性和准确性。