1. logistic回歸分析的使用條件是什麼
Logit回歸分析用於研究X對Y的影響,並且對X的數據類型沒有要求,X可以為定類數據(可以做虛擬變數設置),也可以為定量數據,但要求Y必須為定類數據,並且根據Y的選項數,使用相應的數據分析方法。Logit回歸分析一般可分為三類,分別是二元logit回歸、多分類logit回歸、有序logit回歸。
二元logit分析用於研究X對於Y的影響關系,其中X通常為定量數據,如果X為定類數據,一般需要做虛擬啞變數處理。Y為二分類定類數據,例如願意和不願意、是和否等。數據處理時,如果是定類數據,則首先對它們做虛擬啞變數處理。因變數Y只能包括數字0和1,如果因變數的原始數據不是這樣,則需要數據編碼,設置成0和1。
在SPSSAU中上傳數據後,拖拽分析項選擇「二元Logit」方法,將Y定類變數放於上方分析框內,X定類/定量變數放於下方分析框內,點擊「開始分析」。可以勾選「保存殘差和預測值」將殘差和預測值保存起來,用於進一步分析。在分析前,如果X為定類數據,可以考慮使用交叉卡方分析去研究X和Y的關系。如果有多個X變數,可以先對定類的X與Y進行卡方分析,對定量的X與Y進行方差分析(或t檢驗),先看有沒有差異關系,將最終有差異關系的X放入二元Logit回歸模型中。
研究影響用戶購買某品牌筆記本電腦的因素時,將價格、品牌偏好度、性能作為自變數,而將是否購買某品牌筆記本電腦作為因變數進行二元Logit回歸分析。從分析結果可以得知,價格、性能會對是否購買某品牌筆記本電腦產生顯著的正向影響關系,而品牌偏好度並不會對是否購買某品牌筆記本電腦產生影響關系。
多分類logit分析用於因變數Y有多個選項,並且各個選項之間不具有對比意義的情況,例如,1代表「黑龍江省」,2代表「雲南省」,3代表「四川省」,4代表「陝西省」,數值僅代表不同類別。數據要求與處理時,如果因變數Y的類別個數很多,建議進行組合下,盡量減少類別數量。定類數據需做虛擬啞變數處理。
有序logit分析用於因變數Y有多個選項,並且各個選項之間具有對比意義的情況,例如:1代表不滿意,2代表一般,3代表滿意。分析時首先進行模型平行性檢驗,如果通過平行性檢驗,則繼續進行分析。
總結,Logit回歸分析適用於研究定類數據對定類數據的影響,具體使用哪種Logit回歸方法,需根據因變數Y的選項數來確定。在分析前,需確保數據的正確處理和初步分析,以確保模型的有效性和准確性。