淺談階層線性迴歸(Hierarchical linear model, HLM)
如同結構方程模型(SEM)是一種統計方法,階層線性迴歸(HLM)亦是一種統計方法,這種方法其實已經被應用幾十年了(Hofman, 1997),過去多用在商業組織、教育等方面的研究,但近年來也越來越多心理學的研究開始應用這套統計方法。而HLM這樣的統計方法,相當適合做為階層性資料的分析方法。所謂階層性資料指的是,當我們在研究學生社經地位對其學習成績的影響時,我們會發現,學生其實是隸屬於或鑲嵌在(nested)學校之中的,而學校又歸屬於不同城市之下,因此當我們在探討學生社經地位對學習成績的影響時,因為不同的學校教育方針可能會影響到學生的社經地位的高低(學校對學生會有影響),而不同城市的城鄉差距,可能又會對不同學校的教育方針(城市對學校)有影響,因此我們無可避免的需要將不同的學校和不同的城市列入考量,才能得到較精確的結果,這時我們就會有三種不同的階層:第一個階層是「學生」,第二個階層是「學校」,第三個階層是「城市」,而這也就是我們所謂的階層性資料。
這種統計方法的好處在於,當我們所收集的是屬於階層性的資料時,利用HLM能夠避免傳統統計方法在估計上可能產生的問題。其中若我們用過去的傳統迴歸方程式同時考量學生、學校和城市這三種不同的變項時,我們必須把這三個變項同時放入迴歸式中,也就是:
但這時我們會發現,因為城市會影響學校,學校又會影響到學生,因此這將違反傳統迴歸分析中各變項須相互獨立的假設,導致分析上的錯誤。另一方面,實際上,學生階層的誤差、學校階層的誤差和城市階層的誤差應該都是有所不同的,但在傳統迴歸式中,我們會發現,這三種不同的誤差都被混在中,而沒辦法區分到底哪個階層所佔的誤差或重要的性最高。
再舉一個例子來說,如果有一個研究發現「工作時數」和「生活滿意度」的關係如下圖時:
我們可能會誤以為生活滿意度和工作時數間是有正相關的,也就是說,我們會發現甚至下結論說「工作時數與生活滿意度之間有正相關存在」。但當我們利用HLM,加入公司這個層次後,近一步看待這筆資料時,我們可能會發現到如下的結果:
也就是說,這時我們會發現,其實各個公司間它門的工作時數和生活滿意度其實是負相關的,但當我們沒有進一步考量公司這個層次時,便有可能會得出錯誤的結論,這也是為什麼我會需要用HLM分析階層性之資料的原因之一。
HLM的原則其實也是建立在傳統線性迴歸上,但它多了階層的概念,它的二階層模型大致如下:
Yij指的是結果變項(依變項),Xij指的是層一的預測變項,Wj則是層二的預測變項。簡單來說,在HLM中,我們能夠用層二的預測變項去預測層一的截距和斜率,如果層一的預測變項是學生的社經地位,結果變項是學生的成績,而層二的預測變項是學校的管教程度時,我們就可以利用HLM來探討各學校不同的管教程度是不是會影響到學生的數學成績(截距),或學校的管教程度會不會影響到學生社經地位對數學成績的關係(斜率)。
上述是HLM的簡單介紹,因為是自學的關係,若有任何錯誤也麻煩告知,最後須注意的是,階層線性模式(Hierarchical linear model)和階層迴歸(hierarchical regression)是不同的,後者仍然是傳統的迴歸方法,但僅是將變項以不同的順序放入迴歸模型中。
參考資料
Hofmann DA (1997). An overview of the logic and rationale of hierarchical linear models. Journal of Management, 23, 723-744
階層線性模式(郭志剛譯)(民國97年)。台北市:五南。(原著出版年:2002年)
如同結構方程模型(SEM)是一種統計方法,階層線性迴歸(HLM)亦是一種統計方法,這種方法其實已經被應用幾十年了(Hofman, 1997),過去多用在商業組織、教育等方面的研究,但近年來也越來越多心理學的研究開始應用這套統計方法。而HLM這樣的統計方法,相當適合做為階層性資料的分析方法。所謂階層性資料指的是,當我們在研究學生社經地位對其學習成績的影響時,我們會發現,學生其實是隸屬於或鑲嵌在(nested)學校之中的,而學校又歸屬於不同城市之下,因此當我們在探討學生社經地位對學習成績的影響時,因為不同的學校教育方針可能會影響到學生的社經地位的高低(學校對學生會有影響),而不同城市的城鄉差距,可能又會對不同學校的教育方針(城市對學校)有影響,因此我們無可避免的需要將不同的學校和不同的城市列入考量,才能得到較精確的結果,這時我們就會有三種不同的階層:第一個階層是「學生」,第二個階層是「學校」,第三個階層是「城市」,而這也就是我們所謂的階層性資料。
這種統計方法的好處在於,當我們所收集的是屬於階層性的資料時,利用HLM能夠避免傳統統計方法在估計上可能產生的問題。其中若我們用過去的傳統迴歸方程式同時考量學生、學校和城市這三種不同的變項時,我們必須把這三個變項同時放入迴歸式中,也就是:
但這時我們會發現,因為城市會影響學校,學校又會影響到學生,因此這將違反傳統迴歸分析中各變項須相互獨立的假設,導致分析上的錯誤。另一方面,實際上,學生階層的誤差、學校階層的誤差和城市階層的誤差應該都是有所不同的,但在傳統迴歸式中,我們會發現,這三種不同的誤差都被混在中,而沒辦法區分到底哪個階層所佔的誤差或重要的性最高。
再舉一個例子來說,如果有一個研究發現「工作時數」和「生活滿意度」的關係如下圖時:
我們可能會誤以為生活滿意度和工作時數間是有正相關的,也就是說,我們會發現甚至下結論說「工作時數與生活滿意度之間有正相關存在」。但當我們利用HLM,加入公司這個層次後,近一步看待這筆資料時,我們可能會發現到如下的結果:
也就是說,這時我們會發現,其實各個公司間它門的工作時數和生活滿意度其實是負相關的,但當我們沒有進一步考量公司這個層次時,便有可能會得出錯誤的結論,這也是為什麼我會需要用HLM分析階層性之資料的原因之一。
HLM的原則其實也是建立在傳統線性迴歸上,但它多了階層的概念,它的二階層模型大致如下:
Yij指的是結果變項(依變項),Xij指的是層一的預測變項,Wj則是層二的預測變項。簡單來說,在HLM中,我們能夠用層二的預測變項去預測層一的截距和斜率,如果層一的預測變項是學生的社經地位,結果變項是學生的成績,而層二的預測變項是學校的管教程度時,我們就可以利用HLM來探討各學校不同的管教程度是不是會影響到學生的數學成績(截距),或學校的管教程度會不會影響到學生社經地位對數學成績的關係(斜率)。
上述是HLM的簡單介紹,因為是自學的關係,若有任何錯誤也麻煩告知,最後須注意的是,階層線性模式(Hierarchical linear model)和階層迴歸(hierarchical regression)是不同的,後者仍然是傳統的迴歸方法,但僅是將變項以不同的順序放入迴歸模型中。
參考資料
Hofmann DA (1997). An overview of the logic and rationale of hierarchical linear models. Journal of Management, 23, 723-744
階層線性模式(郭志剛譯)(民國97年)。台北市:五南。(原著出版年:2002年)
文章標籤
全站熱搜

很受用,謝謝🙏