|
因子分析把數(shù)據(jù)看作公共因子,特殊因子和誤差構(gòu)成。主成分分析把方差劃分為不同的正交成分,因子分析則把方差劃分為不同的起因因子,其特征值計算是從相關(guān)矩陣出發(fā),且將主成分轉(zhuǎn)換為因子并計算出因子得分。目前在心理學,生物學和經(jīng)濟學中廣泛使用。 數(shù)學模型: 其中X[n,p]為p維原始數(shù)據(jù),A[p,m]為因子載荷矩陣,F(xiàn)=f1,f2...fm為公共因子向量,e=e1,e1...為特殊因子,m<=p為公共因子數(shù)。其中因子載荷矩陣A不是唯一的夬,這樣可以通過因子旋轉(zhuǎn)使得新因子有更好的實際意義. 因子分析,回歸分析和主成分分析的區(qū)別: 因子分析與回歸分析不同,因子分析中的因子是一個比較抽象的概念,而回歸因子有非常明確的實際意義。 主成分分析與因子分析也不同,主成分分析僅僅是變量變換,而因子分析需要構(gòu)造因子模型。 主成分分析,用原始變量的線性組合表示新的綜合變量,即主成分。 因子分析:潛在的假象變量和隨機影響變量的線性組合表示原始變量。 R中函數(shù)factanal()執(zhí)行因子分析,用法: factanal(x, factors, da subset, na.act scores = c("none", "regression", "Bartlett"), rotation = "varimax", control = NULL, ...) x數(shù)據(jù)框或數(shù)據(jù)矩陣;covmat樣本的協(xié)方差陣或相關(guān)矩陣,scores因子得分計算方法。 下面是R中的數(shù)據(jù), 可以假設(shè)為公司18個員工對公司各項調(diào)查結(jié)果的滿意度 > v1 <- c(1,1,1,1,1,1,1,1,1,1,3,3,3,3,3,4,5,6)
> v2 <- c(1,2,1,1,1,1,2,1,2,1,3,4,3,3,3,4,6,5)
> v3 <- c(3,3,3,3,3,1,1,1,1,1,1,1,1,1,1,5,4,6)
> v4 <- c(3,3,4,3,3,1,1,2,1,1,1,1,2,1,1,5,6,4)
> v5 <- c(1,1,1,1,1,3,3,3,3,3,1,1,1,1,1,6,4,5)
> v6 <- c(1,1,1,2,1,3,3,3,4,3,1,1,1,2,1,6,5,4)
> m1 <- cbind(v1,v2,v3,v4,v5,v6)
> factanal(m1, factors = 3) #默認不計算因子得分
Call:
factanal(x = m1, factors = 3)
Uniquenesses:#特殊因子
v1 v2 v3 v4 v5 v6
0.005 0.101 0.005 0.224 0.084 0.005
Loadings:#因子載荷矩陣(用來分析解釋各個因子的含義)
Factor1 Factor2 Factor3
v1 0.944 0.182 0.267
v2 0.905 0.235 0.159
v3 0.236 0.210 0.946
v4 0.180 0.242 0.828
v5 0.242 0.881 0.286
v6 0.193 0.959 0.196
Factor1 Factor2 Factor3
SS loadings 1.893 1.886 1.797 #公共因子fi對變量v1,v2....v6的方差總貢獻
Proportion Var 0.316 0.314 0.300 #方差貢獻率(將來可以作為綜合評價模型中各因子的權(quán)重w1,w2,w3),三個因子的貢獻率差不多
Cumulative Var 0.316 0.630 0.929#累計方差貢獻率,總貢獻率達到92.9%
The degrees of freedom for the model is 0 and the fit was 0.4755
#計算18個員工在3個因子上的得分(由此可以算出綜合評價模型中每個員工的因子得分Fij,從而得到綜合評價模型:Sj=w1*F1j+w2*F2j+w3*F3,j=1,2...18,i=1,2,3)
> factanal(~v1+v2+v3+v4+v5+v6, factors = 3,
+ scores = "Bartlett")$scores
Factor1 Factor2 Factor3
1 -0.9039949 -0.9308984 0.9475392
2 -0.8685952 -0.9328721 0.9352330
3 -0.9082818 -0.9320093 0.9616422
4 -1.0021975 -0.2529689 0.8178552
5 -0.9039949 -0.9308984 0.9475392
6 -0.7452711 0.7273960 -0.7884733
7 -0.7098714 0.7254223 -0.8007795
8 -0.7495580 0.7262851 -0.7743704
9 -0.8080740 1.4033517 -0.9304636
10 -0.7452711 0.7273960 -0.7884733
11 0.9272282 -0.9307506 -0.8371538
12 0.9626279 -0.9327243 -0.8494600
13 0.9229413 -0.9318615 -0.8230509
14 0.8290256 -0.2528211 -0.9668378
15 0.9272282 -0.9307506 -0.8371538
16 0.4224366 2.0453079 1.2864761
17 1.4713902 1.2947716 0.5451562
18 1.8822320 0.3086244 1.9547752
和主成分分析對照
> prcomp(m1,scale=TRUE)
Standard deviations:
[1] 1.9225064 1.0359124 1.0003870 0.4012524 0.2023886 0.1676783
Rotation:
PC1 PC2 PC3 PC4 PC5 PC6
v1 0.4154985 -0.53088297 0.1760717 -0.2791358 0.5317514 -0.39223298
v2 0.4007058 -0.54223870 0.2485226 0.3048547 -0.5042931 0.36932463
v3 0.4133938 0.07418871 -0.5496063 -0.5693303 -0.4344463 -0.09302655
v4 0.3940548 0.08433475 -0.5976225 0.5877130 0.3543977 0.09721936
v5 0.4206885 0.44028459 0.3342420 -0.2798686 0.2920358 0.59484588
v6 0.4045287 0.46655507 0.3691854 0.2850910 -0.2516003 -0.58121033
> summary(prcomp(m1,scale=TRUE))
Imp
PC1 PC2 PC3 PC4 PC5 PC6
Standard deviation 1.923 1.0359 1.0004 0.40125 0.20239 0.16768
Proportion of Variance 0.616 0.1789 0.1668 0.02683 0.00683 0.00469
Cumulative Proportion 0.616 0.7949 0.9617 0.98849 0.99531 1.00000
> |
|
|