Ⅰ 因子分析的目的
問題一:因子分析到底有什麼用處? 問題:大家覺得因子分析到底有什幺用處呢?把原來很多個影響因素歸納成幾個影響因子,如果不繼續做回歸或者聚類的話,光做因子分析有價值嗎?答復:因子分析是將多個實測變數轉換為少數幾個綜合指標(或稱潛變數),它反映一種降維的思想。通過降維將相關性高的變數聚在一起,從而減少需要分析的變數的數量,而減少問題分析的復雜性。在你對問題系統結構不了解時候,因子分析可以根據數據內在邏輯性,把它歸並成幾個公因子,每個公因子分別代表空間的一個維度,如果經過正交或斜 交旋轉的話,各個維度之間可以認為是不相關的,這些公因子能夠相對完整地刻畫對象的體系維度,最起碼累計方差貢獻率大於85%的話,就基本能夠保證重要信 息不丟失了。一句話,你如果對研究對象到底應該分為幾個維度不清楚的話,用因子分析可以通過數據內在邏輯告訴你。但如果你對研究對象體系比較清楚的話,那你直接確定維度,通過AHP計算出權重,就能夠把系統表述清楚了。但這裡面有巨大問題,單純通過數據內 在邏輯來判斷維度,常常是錯誤的,而主觀判斷其實更加科學,並非象統計學宣稱的,數據說話才有發言權。真正有發言權的,是你對問題的經驗認識程度。人們為 了避免被人嘲笑主觀判斷的失誤,而越來越選擇了統計分析,實際上,他們並不清楚,單純用統計分析來做判斷,才是最愚蠢的。只有主客觀結合起來,才是相對科 學的,兩者矛盾的時候,應該深入研究矛盾的根源,搞不清楚的話,我認為指標體系評價法要遠比統計分析准確的多。而變數之所以能分布在不同的因子內,則是由 於其方差波動性大小和變數之間的相關性決定的,波動性越大,越排在前面的公因子中,各個公因子之間的變數是不相關的,而每個公因子之間的變數是相關的。因 子分析認為那些數據波動大的變數對對象影響作用更大,它們排在公因子的前列,這樣單純從數據邏輯來判斷的准則你認為對嗎?我想,如果管理和社會科學都這幺 認為的話,那錯誤將大大增加了。上面想法是我這兩年做課題的體會,沒有在任何一本書上看過相關說法,也許說的不對,這是我個人看法。如果讓我選擇的話,我 寧願用指標體系評價法,體系幾個維度事先就清楚,最多先用因子分析算算,看看數據波動性如何,到底能確定幾個維度,只起輔助作用。研究者就是專家,指標體 系的維度由主觀來做判斷,這主要來自經驗判斷,而不是由數據判斷,我認為其實更科學。當然,如果你對問題一無所知,那指標體系評價法用AHP來做的話,錯 誤很可能更多。我以前就強烈批判過AHP。說到底,沒有一種評價方法是好的,說明問題就好。問題:那能對LISREL進行類似於因子分析的探索性因素分析了解嗎?能給點評價么?3x答復:下面是探索性分析的原理:傳統上所談的因素分析)factor *** ysis)指的是探索性因素分析)exploratory factor *** ysis),它的目的是在承認有測量誤差的情形下,嘗試用少數的因素)factors)以解釋許多變項間的相關關系。隨著統計理論及電腦計算上的進展,目前因素分析的方法可分成探索性因素分析)exploratory factor *** ysis,EFA)及驗證性因素分析)confirmatory factor *** ysis,CFA),這兩類分析之間的差別在於研究者對研究變項間因素結構的了解程度不同。如果研究者對資料內所含的因素性質,結構及個數不是很 清楚,則可使用探索性因素分析試圖找出能解釋資料變項間相關關系的少數幾個重要因素。若研究者從過去文獻中的理論及自己的研究經驗,而對資料間因素之數 目,結構有一定程度的了解及假設,則可使用驗證性因素分析來驗證該假設是否能解......>>
問題二:請教SPSS高人,主成份分析和因子分析有什麼不同?做主成分分析目的是什麼?謝謝 主成分分析可以理解為一種數據的處理理論,也可以理解為一種應用方法。而因子分析則可以理解為一種應用方法,因為做因子分析採用的比較多的就是用主成分分析的方法來濃縮因子。所以
其實所謂的區別只不過是在學科研究當中存在的,因為同屬於統計學的理論,所以一定要找出兩者的區別來。但是如果你只是應用的話,那就沒必要考慮兩者有什麼區別。
況且spss使用因子分析非常方便 就可以得出各因子的得分,但是如果你非要用主成分分析方法,則需要自己手動再根據spss輸出的某些因子分析結果來計算主成分得分。
做主成分分析或者說因子分析的目的 是為了濃縮眾多變數,使之在後續的計算中更加簡介。比如原來有80多個變數,如果直接進行綜合排名要考慮每個變數進行綜合,所以此時通過主成分分析,可以將原來的80多個變數濃縮成3~5個代替原來眾多變數的新變數 即所謂的主成分或主因子。這樣後續的計算就很簡潔了
問題三:探索性因子分析的目的意義有哪些 看你對變數理論的分組符不符合實際的情況,是確保模型合理性的前提
問題四:請問 做相關分析前,一定要做因子分析嗎?因子分析的目的是什麼? 謝謝! 主成分分析和因子分析的區別 :jok:
1,因子分析中是把變數表示成各因子的線性組合,而主成分分析中則是把主成分表示成
個變數的線性組合。
2,主成分分析的重點在於解釋個變數的總方差,而因子分析則把重點放在解釋各變數之
間的協方差。
3,主成分分析中不需要有假設(assumptions),因子分析則需要一些假設。因子分析的假
設包括:各個共同因子之間不相關,特殊因子(specific factor)之間也不相關,共同
因子和特殊因子之間也不相關。
4,主成分分析中,當給定的協方差矩陣或者相關矩陣的特徵值是唯一的時候,的主成分
一般是獨特的;而因子分析中因子不是獨特的,可以旋轉得到不到的因子。
5,在因子分析中,因子個數需要分析者指定(spss根據一定的條件自動設定,只要是特
征值大於1的因子進入分析),而指
定的因子數量不同而結果不同。在主成分分析中,成分的數量是一定的,一般有幾個變數
就有幾個主成分。
和主成分分析相比,由於因子分析可以使用旋轉技術幫助解釋因子,在解釋方面更加有
優勢。大致說來,當需要尋找潛在的因子,並對這些因子進行解釋的時候,更加傾向於
使用因子分析,並且藉助旋轉技術幫助更好解釋。而如果想把現有的變數變成少數幾個
新的變數(新的變數幾乎帶有原來所有變數的信息)來進入後續的分析,則可以使用主
成分分析。當然,這中情況也可以使用因子得分做到。所以這中區分不是絕對的。
總得來說,主成分分析主要是作為一種探索性的技術,在分析者進行多元數據分析之前
,用主成分分析來分析數據,讓自己對數據有一個大致的了解是非常重要的。主成分分
析一般很少單獨使用:a,了解數據。(screening the data),b,和cluster *** ysis一
起使用,c,和判別分析一起使用,比如當變數很多,個案數不多,直接使用判別分析可
能無解,這時候可以使用主成份發對變數簡化。(rece dimensionality)d,在多元回
歸中,主成分分析可以幫助判斷是否存在共線性(條件指數),還可以用來處理共線性
。
在演算法上,主成分分析和因子分析很類似,不過,在因子分析中所採用的協方差矩陣的
對角元素不在是變數的方差,而是和變數對應的共同度(變數方差中被各因子所解釋的
問題五:因子分析中正交旋轉的原因和目的是什麼? 因子分析中正交旋轉的原因和目的是:為了更突出各個因子的典型代表變數是誰,這樣更容易發覺因子的作用。
因子分析的基本目的就是用少數幾個因子去描述許多指標或因素之間的聯系,即將相關比較密切的幾個變數歸在同一類中,每一類變數就成為一個因子,以較少的幾個因子反映原資料的大部分信息。運用這種研究技術,我們可以方便地找出影響消費者購買、消費以及滿意度的主要因素是哪些,以及它們的影響力運用這種研究技術,我們還可以為市場細分做前期分析。
問題六:因子分析法的統計意義 模型中F1,F2,…,Fm叫做主因子或公共因子,它們是在各個原觀測變數的表達式中都共同出現的因子,是相互獨立的不可觀測的理論變數。公共因子的含義,必須結合具體問題的實際意義而定。e1,e2,…,ep叫做特殊因子,是向量x的分量xi(i=1,2,…,p)所特有的因子,各特殊因子之間以及特殊因子與所有公共因子之間都是相互獨立的。模型中載荷矩陣A中的元素(aij)是為因子載荷。因子載荷aij是xi與Fj的協方差,也是xi與Fj的相關系數,它表示xi依賴Fj的程度。可將aij看作第i個變數在第j公共因子上的權,aij的絕對值越大(|aij|£1),表明xi與Fj的相依程度越大,或稱公共因子Fj對於xi的載荷量越大。為了得到因子分析結果的經濟解釋,因子載荷矩陣A中有兩個統計量十分重要,即變數共同度和公共因子的方差貢獻。因子載荷矩陣A中第i行元素之平方和記為hi2,稱為變數xi的共同度。它是全部公共因子對xi的方差所做出的貢獻,反映了全部公共因子對變數xi的影響。hi2大表明x的第i個分量xi對於F的每一分量F1,F2,…,Fm的共同依賴程度大。將因子載荷矩陣A的第j列( j =1,2,…,m)的各元素的平方和記為gj2,稱為公共因子Fj對x的方差貢獻。gj2就表示第j個公共因子Fj對於x的每一分量xi(i= 1,2,…,p)所提供方差的總和,它是衡量公共因子相對重要性的指標。gj2越大,表明公共因子Fj對x的貢獻越大,或者說對x的影響和作用就越大。如果將因子載荷矩陣A的所有gj2 ( j =1,2,…,m)都計算出來,使其按照大小排序,就可以依此提煉出最有影響力的公共因子。3. 因子旋轉建立因子分析模型的目的不僅是找出主因子,更重要的是知道每個主因子的意義,以便對實際問題進行分析。如果求出主因子解後,各個主因子的典型代表變數不很突出,還需要進行因子旋轉,通過適當的旋轉得到比較滿意的主因子。旋轉的方法有很多,正交旋轉(orthogonal rotation)和斜交旋轉(oblique rotation)是因子旋轉的兩類方法。最常用的方法是最大方差正交旋轉法(Varimax)。進行因子旋轉,就是要使因子載荷矩陣中因子載荷的平方值向0和1兩個方向分化,使大的載荷更大,小的載荷更小。因子旋轉過程中,如果因子對應軸相互正交,則稱為正交旋轉;如果因子對應軸相互間不是正交的,則稱為斜交旋轉。常用的斜交旋轉方法有Promax法等。4.因子得分因子分析模型建立後,還有一個重要的作用是應用因子分析模型去評價每個樣品在整個模型中的地位,即進行綜合評價。例如地區經濟發展的因子分析模型建立後,我們希望知道每個地區經濟發展的情況,把區域經濟劃分歸類,哪些地區發展較快,哪些中等發達,哪些較慢等。這時需要將公共因子用變數的線性組合來表示,也即由地區經濟的各項指標值來估計它的因子得分。設公共因子F由變數x表示的線性組合為:Fj = uj1 xj1+ uj2 xj2+…+ujp *** j=1,2,…,m該式稱為因子得分函數,由它來計算每個樣品的公共因子得分。若取m=2,則將每個樣品的p個變數代入上式即可算出每個樣品的因子得分F1和F2,並將其在平面上做因子得分散點圖,進而對樣品進行分類或對原始數據進行更深入的研究。但因子得分函數中方程的個數m小於變數的個數p,所以並不能精確計算出因子得分,只能對因子得分進行估計。估計因子得分的方法較多,常用的有回歸估計法,Bartlett估計法,Thomson估計法。⑴回歸估計法F = X b = X (X ¢X)-1A¢ = XR-1A......>>
問題七:主成分分析和因子分析有什麼區別? 因子分析與主成分分析的異同點:
都對原始數據進行標准化處理; 都消除了原始指標的相關性對綜合評價所造成的信息重復的影響; 構造綜合評價時所涉及的權數具有客觀性; 在信息損失不大的前提下,減少了評價工作量
公共因子比主成分更容易被解釋; 因子分析的評價結果沒有主成分分析准確; 因子分析比主成分分析的計算工作量大
主成分分析僅僅是變數變換,而因子分析需要構造因子模型。
主成分分析:原始變數的線性組合表示新的綜合變數,即主成分;
因子分析:潛在的假想變數和隨機影響變數的線性組合表示原始變數。
問題八:在因子分析中計算變數共同度的目的是可以反映什麼 所提供公因子可以解釋原始變數的方差程度。
問題九:因子分析常用來解決什麼問題,目標是什麼 主要是用來尋找指標變了共同的潛變數或稱公因子,然後用公因子進行後續的各項分析,達到降維的目的。(南心網為您解決SPSS因子分析問題)
Ⅱ 因子分析法的概念
1.主成分分析
主成分分析主要是一種探索性的技術,在分析者進行多元數據分析之前,用他來分析數據,讓自己對數據有一個大致的了解,這是非常有必要的。主成分分析一般很少單獨使用:a、了解數據。(screening the data),b、和cluster analysis(聚類分析)一起使用,c、和判別分析一起使用,比如當變數很多,個案數不多,直接使用判別分析可能無解,這時候可以使用主成分對變數簡化(rece dimensionality),d、在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數),還可以用來處理共線性。
1、因子分析中是把變數表示成各因子的線性組合,而主成分分析中則是把主成分表示成各變數的線性組合。
2、主成分分析的重點在於解釋各變數的總方差,而因子分析則把重點放在解釋各變數之間的協方差。
3、主成分分析中不需要有假設(assumptions),因子分析則需要一些假設。因子分析的假設包括:各個共同因子之間不相關,特殊因子(specific factor)之間也不相關,共同因子和特殊因子之間也不相關。
4、主成分分析中,當給定的協方差矩陣或者相關矩陣的特徵值是唯一的時候,主成分一般是獨特的;而因子分析中因子不是獨特的,可以旋轉得到不同的因子。
5、在因子分析中,因子個數需要分析者指定(spss根據一定的條件自動設定,只要是特徵值大於1的因子進入分析),而指定的因子數量不同而結果不同。在主成分分析中,成分的數量是一定的,一般有幾個變數就有幾個主成分。和主成分分析相比,由於因子分析可以使用旋轉技術幫助解釋因子,在解釋方面更加有優勢。大致說來,當需要尋找潛在的因子,並對這些因子進行解釋的時候,更加傾向於使用因子分析,並且藉助旋轉技術幫助更好解釋。而如果想把現有的變數變成少數幾個新的變數(新的變數幾乎帶有原來所有變數的信息)來進入後續的分析,則可以使用主成分分析。當然,這種情況也可以使用因子得分做到。所以這種區分不是絕對的。
在演算法上,主成分分析和因子分析很類似,不過在因子分析中所採用的協方差矩陣的對角元素不再是變數的方差,而是和變數對應的共同度(變數方差中被各因子所解釋的部分)。
2.聚類分析(Cluster Analysis)
聚類分析是直接比較各事物之間的性質,將性質相近的歸為一類,將性質差別較大的歸入不同的類的分析技術。
在市場研究領域,聚類分析主要應用方面是幫助我們尋找目標消費群體,運用這項研究技術,我們可以劃分出產品的細分市場,並且可以描述出各細分市場的人群特徵,以便於客戶可以有針對性的對目標消費群體施加影響,合理地開展工作。
3.判別分析(Discriminatory Analysis)
判別分析(Discriminatory Analysis)的任務是根據已掌握的1批分類明確的樣品,建立較好的判別函數,使產生錯判的事例最少,進而對給定的1個新樣品,判斷它來自哪個總體。根據資料的性質,分為定性資料的判別分析和定量資料的判別分析;採用不同的判別准則,又有費歇、貝葉斯、距離等判別方法。
費歇(FISHER)判別思想是投影,使多維問題簡化為一維問題來處理。選擇一個適當的投影軸,使所有的樣品點都投影到這個軸上得到一個投影值。對這個投影軸的方向的要求是:使每一類內的投影值所形成的類內離差盡可能小,而不同類間的投影值所形成的類間離差盡可能大。貝葉斯(BAYES)判別思想是根據先驗概率求出後驗概率,並依據後驗概率分布作出統計推斷。所謂先驗概率,就是用概率來描述人們事先對所研究的對象的認識的程度;所謂後驗概率,就是根據具體資料、先驗概率、特定的判別規則所計算出來的概率。它是對先驗概率修正後的結果。
距離判別思想是根據各樣品與各母體之間的距離遠近作出判別。即根據資料建立關於各母體的距離判別函數式,將各樣品數據逐一代入計算,得出各樣品與各母體之間的距離值,判樣品屬於距離值最小的那個母體。
4.對應分析(Correspondence Analysis)
對應分析是一種用來研究變數與變數之間聯系緊密程度的研究技術。
運用這種研究技術,我們可以獲取有關消費者對產品品牌定位方面的圖形,從而幫助您及時調整營銷策略,以便使產品品牌在消費者中能樹立起正確的形象。
這種研究技術還可以用於檢驗廣告或市場推廣活動的效果,我們可以通過對比廣告播出前或市場推廣活動前與廣告播出後或市場推廣活動後消費者對產品的不同認知圖來看出廣告或市場推廣活動是否成功的向消費者傳達了需要傳達的信息。
5.典型相關分析
典型相關分析是分析兩組隨機變數間線性密切程度的統計方法,是兩變數間線性相關分析的拓廣。各組隨機變數中既可有定量隨機變數,也可有定性隨機變數(分析時須F6說明為定性變數)。本法還可以用於分析高維列聯表各邊際變數的線性關系。
注意
1.嚴格地說,一個典型相關系數描述的只是一對典型變數之間的相關,而不是兩個變數組之間的相關。而各對典型變數之間構成的多維典型相關才共同揭示了兩個觀測變數組之間的相關形式。
2.典型相關模型的基本假設和數據要求
要求兩組變數之間為線性關系,即每對典型變數之間為線性關系;
每個典型變數與本組所有觀測變數的關系也是線性關系。如果不是線性關系,可先線性化:如經濟水平和收入水平與其他一些社會發展水之間並不是線性關系,可先取對數。即log經濟水平,log收入水平。
3.典型相關模型的基本假設和數據要求
所有觀測變數為定量數據。同時也可將定性數據按照一定形式設為虛擬變數後,再放入典型相關模型中進行分析。
6.多維尺度分析(Multi-dimension Analysis)
多維尺度分析(Multi-dimension Analysis) 是市場研究的一種有力手段,它可以通過低維空間(通常是二維空間)展示多個研究對象(比如品牌)之間的聯系,利用平面距離來反映研究對象之間的相似程度。由於多維尺度分析法通常是基於研究對象之間的相似性(距離)的,只要獲得了兩個研究對象之間的距離矩陣,我們就可以通過相應統計軟體做出他們的相似性知覺圖。
在實際應用中,距離矩陣的獲得主要有兩種方法:一種是採用直接的相似性評價,先將所有評價對象進行兩兩組合,然後要求被訪者所有的這些組合間進行直接相似性評價,這種方法我們稱之為直接評價法;另一種為間接評價法,由研究人員根據事先經驗,找出影響人們評價研究對象相似性的主要屬性,然後對每個研究對象,讓被訪者對這些屬性進行逐一評價,最後將所有屬性作為多維空間的坐標,通過距離變換計算對象之間的距離。
多維尺度分析的主要思路是利用對被訪者對研究對象的分組,來反映被訪者對研究對象相似性的感知,這種方法具有一定直觀合理性。同時該方法實施方便,調查中被訪者負擔較小,很容易得到理解接受。當然,該方法的不足之處是犧牲了個體距離矩陣,由於每個被訪者個體的距離矩陣只包含1與0兩種取值,相對較為粗糙,個體距離矩陣的分析顯得比較勉強。但這一點是完全可以接受的,因為對大多數研究而言,我們並不需要知道每一個體的空間知覺圖。
多元統計分析是統計學中內容十分豐富、應用范圍極為廣泛的一個分支。在自然科學和社會科學的許多學科中,研究者都有可能需要分析處理有多個變數的數據的問題。能否從表面上看起來雜亂無章的數據中發現和提煉出規律性的結論,不僅對所研究的專業領域要有很好的訓練,而且要掌握必要的統計分析工具。對實際領域中的研究者和高等院校的研究生來說,要學習掌握多元統計分析的各種模型和方法,手頭有一本好的、有長久價值的參考書是非常必要的。這樣一本書應該滿足以下條件:首先,它應該是「淺入深出」的,也就是說,既可供初學者入門,又能使有較深基礎的人受益。其次,它應該是既側重於應用,又兼顧必要的推理論證,使學習者既能學到「如何」做,而且在一定程度上了解「為什麼」這樣做。最後,它應該是內涵豐富、全面的,不僅要基本包括各種在實際中常用的多元統計分析方法,而且還要對現代統計學的最新思想和進展有所介紹、交代。
主成分分析通過線性組合將原變數綜合成幾個主成分,用較少的綜合指標來代替原來較多的指標(變數)。在多變數分析中,某些變數間往往存在相關性。是什麼原因使變數間有關聯呢?是否存在不能直接觀測到的、但影響可觀測變數變化的公共因子?因子分析法(Factor Analysis)就是尋找這些公共因子的模型分析方法,它是在主成分的基礎上構築若干意義較為明確的公因子,以它們為框架分解原變數,以此考察原變數間的聯系與區別。
例如,隨著年齡的增長,兒童的身高、體重會隨著變化,具有一定的相關性,身高和體重之間為何會有相關性呢?因為存在著一個同時支配或影響著身高與體重的生長因子。那麼,我們能否通過對多個變數的相關系數矩陣的研究,找出同時影響或支配所有變數的共性因子呢?因子分析就是從大量的數據中「由表及裡」、「去粗取精」,尋找影響或支配變數的多變數統計方法。
可以說,因子分析是主成分分析的推廣,也是一種把多個變數化為少數幾個綜合變數的多變數分析方法,其目的是用有限個不可觀測的隱變數來解釋原始變數之間的相關關系。
因子分析主要用於:1、減少分析變數個數;2、通過對變數間相關關系探測,將原始變數進行分類。即將相關性高的變數分為一組,用共性因子代替該組變數。