您现在的位置是: 首页 > 二手车行情 二手车行情

主成分分析评估二手车,主成分分析 得分

tamoadmin 2024-06-10 人已围观

简介1.主成分分析法与因子分析法的区别2.因子分析和主成分分析有什么区别啊3.spss主成分分析结果解读4.主成分分析和因子分析十大不同点5.主成分分析法6.主成分分析和层次分析法的区别是什么?主成分分析法的步骤:对原始数据标准化、计算相关系数、计算特征、确定主成分、合成主成分。主成分分析是指通过将一组可能存在相关性的变量转换城一组线性不相关的变量,转换后的这组变量叫主成分。在实际课题中,为了全面分析

1.主成分分析法与因子分析法的区别

2.因子分析和主成分分析有什么区别啊

3.spss主成分分析结果解读

4.主成分分析和因子分析十大不同点

5.主成分分析法

6.主成分分析和层次分析法的区别是什么?

主成分分析评估二手车,主成分分析 得分

主成分分析法的步骤:对原始数据标准化、计算相关系数、计算特征、确定主成分、合成主成分。

主成分分析是指通过将一组可能存在相关性的变量转换城一组线性不相关的变量,转换后的这组变量叫主成分。

在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。主成分分析首先是由K.皮尔森对非随机变量引入的,尔后H。霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。

主成分分析法的原理

在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。

主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。

主成分分析法与因子分析法的区别

主成分分析方法是一种将多个指标化为少数几个不相关的综合指标(即主成分)的多元统计分析方法。由于其具有消除各指标不同量纲的影响,以及消除指标间相关性所带来的信息重叠等优点,近几年,该方法在社会经济、管理、自然科学等众多领域得到了广泛的应用,尤其是被用于系统综合评价。 在使用主成分分析方法做综合评价的过程中,由于部分学者对主成分分析的原理及主成分的定义理解不深,出现了不少错误。 本文通过分析主成分分析的原理及综合评价的特点,从理论和实际例子上证实了有关文献作者在用主成分做综合评价过程中某些做法的不合理性。给出了主成分做综合评价的充要条件,阐明了主成分所含信息量的大小与综合水平之间的差异,为充分利用形状因子(反映指标间结构性差异的主成分)提供的有效信息,提出了一种定性与定量相结合的评价体系。并通过一个实例讲解了评价过程。

因子分析和主成分分析有什么区别啊

一、性质不同

1、主成分分析法性质:通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量。

2、因子分析法性质:研究从变量群中提取共性因子的统计技术。

二、应用不同

1、主成分分析法应用:比如人口统计学、数量地理学、分子动力学模拟、数学建模、数理分析等学科中均有应用,是一种常用的多变量分析方法。?

2、因子分析法应用:

(1)消费者习惯和态度研究(U&A)

(2) 品牌形象和特性研究

(3)服务质量调查

(4) 个性测试

(5)形象调查

(6) 市场划分识别

(7)顾客、产品和行为分类

扩展资料:

主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时,根据实际需要,尽量少取几个求和变量,以反映原始变量的信息。

这种统计方法被称为主成分分析或主成分分析,这也是一种处理降维的数学方法。主成分分析(PCA)是试图用一组新的不相关的综合指标来代替原来的指标。

因子分析为社会研究的一种有力工具,但不能确定一项研究中有几个因子。当研究中选择的变量发生变化时,因素的数量也会发生变化。此外,对每个因素的实际含义的解释也不是绝对的。

百度百科-主成分分析

百度百科-因子分析

spss主成分分析结果解读

主成分分析和因子分析都是信息浓缩的方法,即将多个分析项信息浓缩成几个概括性指标。

因子分析在主成分基础上,多出一项旋转功能,该旋转目的即在于命名,更容易解释因子的含义。如果研究关注于指标与分析项的对应关系上,或是希望将得到的指标进行命名,SPSSAU建议使用因子分析。

主成分分析目的在于信息浓缩(但不太关注主成分与分析项对应关系),权重计算,以及综合得分计算。如希望进行排名比较,计算综合竞争力,可使用主成分分析。

SPSSAU可直接使用这两种方法,支持自动保存因子得分及综合得分,不需要手动计算。

主成分分析和因子分析十大不同点

1.案例说明

研究调查100家公司2010-2013年关于财务方面的具体数据,这些财务指标维度分别为盈利能力、偿债能力、运营能力、发展能力以及公司治理。其中每个维度分别有几个分析项,但是有些指标是越大越好,有些指标是越小越好。需要在研究前进行数据处理。

2.研究目的

利用偿债能力、运营能力、发展能力以及公司治理四个维度下的分析项进行主成分分析以及判断分析项与主成分之间的关系,利用得到的成分得分进行命名作为线性回归的自变量,用盈利能力下的三个指标作为线性回归的因变量,因为每次线性回归只能放入一个因变量所以重复进行三次分析并且得到结论。

二、数据处理

此案例中有些指标需要提前处理,具体指标隶属维度以及指标性质如下,比如资产负责率是逆向指标可以进行逆向化处理或者取倒数;本文进行取倒数处理,因为比较常见,但是取倒数需要分析项的数据不等于0,其他指标需要正向化处理,公司治理的2个指标可以做正向化处理也可以做适度化,比如认为指标不是越大越好也不是越小越好,接近于某个值或某个范围内认为更好那就使用适度化,此案例中认为越大越好处理为正向化(也有参考文献做适度化处理,建议以参考文献为主)。

首先用SPSSAU将分析项进行“描述分析”观察数据的基本情况。发现资产负债率所有数据均大于0,所以进行处理时可以直接“取倒数”。然后利用SPSSAU“数据处理”中的“生成变量”进行指标处理(一般正逆向化处理后不需要在进行标准化处理,因为已经正逆向化已经处理了量纲问题,但是取倒数后需要进行标准化处理)。

三、主成分结果

分析前已处理过分析项与主成分之间的关系,共进行三次分析结论如下:共有三次分析,第一次分析“应收账款周转率”,“净利润增长率”,“主营业务收入增长率”共3项,共同度小于0.4,将此3项进行删除,删除之后进行第二次分析,发现“每股经营性现金流量”出现“张冠李戴”进行删除处理。而其他出现“纠缠不清”现象的,暂时不处理(进行关注即可)。重新分析后除了“流动比率”、“速动比率”以及“资产负债率”这3项,“销售现金比率”这一项,其余的项均存在“纠缠不清”的现象,但考虑到成分下只余下两项,因而表示可以接受,主成分析分析结束。所以结果将从数据是否适合主成分分析,成分选择个数以及提取成分三部分进行说明。

1.KMO值和巴特球形检验

首先分析研究数据是否适合进行主成分分析,从上表可以看出:KMO为0.614,大于0.6,满足主成分分析的前提要求,以及数据通过Bartlett球形度检验(p<0.05),说明研究数据适合进行主成分分析。

2.成分选择个数

当数据确定可以使用主成分分析后,下一步确定主成分成分选择个数,案例中使用特征根值大于1的方法。

从上表可知:主成分分析一共提取出4个主成分,特征根值均大于1,此4个主成分的方差解释率分别是33.871%,20.571%,15.799%,13.779%,累积方差解释率为84.021%。

3.提取成分

已经确定了成分选择个数经过分析得到载荷系数矩阵如下:

从结果中可以看出,主成分1中主要反映了公司的偿债能力。主成分2中主要反映了公司治理能力,主成分3中主要反映了公司运营能力,主成分4中主要反映了公司发展能力。

整理表格如下:五个成分的名字分别叫F1偿债能力、F2治理能力、F3运营能力以及F4发展能力。

数据通过主成分分析得到四个维度,此案例的主要目的是研究上述四个维度对于公司盈利的影响,最终得到结论。将得到的成分得分利用SPSSAU标题处理进行命名,四个分析项作为线性回归的自变量,盈利能力下的三个指标作为因变量,重复进行三次线性回归,并进行对结果描述,回归结果描述分为两大部分,一为中间分析过程,二为回归分析结果。

四、主成分回归结果

想要得到成分得分可以在分析前勾选“成分得分”按钮,结束分析时SPSSAU单独生成新标题名称类似为:“PCA****_score1”。研究者可通过数据处理->标题处理对名称进行修改即可。

F1偿债能力、F2治理能力、F3运营能力以及F4发展能力如下:

用得到的成分得分进行命名作为线性回归的自变量,用盈利能力下的三个指标作为线性回归的因变量,因为每次线性回归只能放入一个因变量所以重复进行三次分析并且得到结论。

主成分分析法

主成分分析和因子分析十大不同点

主成分分析和因子分析无论从算法上还是应用上都有着比较相似之处,本文结合以往资料以及自己的理解总结了以下十大不同之处,适合初学者学习之用。

1.原理不同

主成分分析基本原理:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标(主成分),即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能(主成分必须保留原始变量90%以上的信息),从而达到简化系统结构,抓住问题实质的目的。

因子分析基本原理:利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。就是要从数据中提取对变量起解释作用的少数公共因子(因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系)

2.线性表示方向不同

因子分析是把变量表示成各公因子的线性组合;而主成分分析中则是把主成分表示成各变量的线性组合。

3.假设条件不同

主成分分析:不需要有假设(assumptions),

因子分析:需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。

4.求解方法不同

求解主成分的方法:从协方差阵出发(协方差阵已知),从相关阵出发(相关阵R已知),采用的方法只有主成分法。

(实际研究中,总体协方差阵与相关阵是未知的,必须通过样本数据来估计)

注意事项:由协方差阵出发与由相关阵出发求解主成分所得结果不一致时,要恰当的选取某一种方法;一般当变量单位相同或者变量在同一数量等级的情况下,可以直接采用协方差阵进行计算;对于度量单位不同的指标或是取值范围彼此差异非常大的指标,应考虑将数据标准化,再由协方差阵求主成分;实际应用中应该尽可能的避免标准化,因为在标准化的过程中会抹杀一部分原本刻画变量之间离散程度差异的信息。此外,最理想的情况是主成分分析前的变量之间相关性高,且变量之间不存在多重共线性问题(会出现最小特征根接近0的情况);

求解因子载荷的方法:主成分法,主轴因子法,极大似然法,最小二乘法,a因子提取法。

5.主成分和因子的变化不同

主成分分析:当给定的协方差矩阵或者相关矩阵的特征值唯一时,主成分一般是固定的独特的;

因子分析:因子不是固定的,可以旋转得到不同的因子。

6.因子数量与主成分的数量

主成分分析:主成分的数量是一定的,一般有几个变量就有几个主成分(只是主成分所解释的信息量不等),实际应用时会根据碎石图提取前几个主要的主成分。

因子分析:因子个数需要分析者指定(SPSS和sas根据一定的条件自动设定,只要是特征值大于1的因子主可进入分析),指定的因子数量不同而结果也不同;

7.解释重点不同:

主成分分析:重点在于解释个变量的总方差,

因子分析:则把重点放在解释各变量之间的协方差。

8.算法上的不同:

主成分分析:协方差矩阵的对角元素是变量的方差;

因子分析:所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)

9.优点不同:

因子分析:对于因子分析,可以使用旋转技术,使得因子更好的得到解释,因此在解释主成分方面因子分析更占优势;其次因子分析不是对原有变量的取舍,而是根据原始变量的信息进行重新组合,找出影响变量的共同因子,化简数据;

主成分分析:

第一:如果仅仅想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析,不过一般情况下也可以使用因子分析;

第二:通过计算综合主成分函数得分,对客观经济现象进行科学评价;

第三:它在应用上侧重于信息贡献影响力综合评价。

第四:应用范围广,主成分分析不要求数据来自正态分布总体,其技术来源是矩阵运算的技术以及矩阵对角化和矩阵的谱分解技术,因而凡是涉及多维度问题,都可以应用主成分降维;

10.应用场景不同:

主成分分析:

可以用于系统运营状态做出评估,一般是将多个指标综合成一个变量,即将多维问题降维至一维,这样才能方便排序评估;

此外还可以应用于经济效益、经济发展水平、经济发展竞争力、生活水平、生活质量的评价研究上;

主成分还可以用于和回归分析相结合,进行主成分回归分析,甚至可以利用主成分分析进行挑选变量,选择少数变量再进行进一步的研究。

一般情况下主成分用于探索性分析,很少单独使用,用主成分来分析数据,可以让我们对数据有一个大致的了解。

几个常用组合:

主成分分析+判别分析,适用于变量多而记录数不多的情况;

主成分分析+多元回归分析,主成分分析可以帮助判断是否存在共线性,并用于处理共线性问题;

主成分分析+聚类分析,不过这种组合因子分析可以更好的发挥优势。

因子分析:

首先,因子分析+多元回归分析,可以利用因子分析解决共线性问题;

其次,可以利用因子分析,寻找变量之间的潜在结构;

再次,因子分析+聚类分析,可以通过因子分析寻找聚类变量,从而简化聚类变量;

此外,因子分析还可以用于内在结构证实

主成分分析和层次分析法的区别是什么?

在对灾毁土地复垦效益进行分析时,会碰到众多因素,各因素间又相互关联,将这些存在相关关系的因素通过数学方法综合成少数几个最终参评因素,使这几个新的因素既包含原来因素的信息又相互独立。简化问题并抓住其本质是分析过程中的关键,主成分分析法可以解决这个难题。

(一)主成分分析的基本原理

主成分分析法(Principal Components Analysis,PCA)是把原来多个变量化为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理方法,即通过对原始指标相关矩阵内部结果关系的研究,将原来指标重新组合成一组新的相互独立的指标,并从中选取几个综合指标来反映原始指标的信息。假定有n个评价单元,每个评价单元用m个因素来描述,这样就构成一个n×m阶数据矩阵:

灾害损毁土地复垦

如果记m个因素为 x1,x2,…,xm,它们的综合因素为 z1,z2,…,zp(p≤m),则:

灾害损毁土地复垦

系数lij由下列原则来决定:

(1)zi与zj(i≠j,i,j=1,2,…,p)相互无关;

(2)z1是x1,x2,…,xm的一切线性组合中方差最大者,依此类推。

依据该原则确定的综合变量指标z1,z2,…,zp分别称为原始指标的第1、第2、…、第p个主成分,分析时可只挑选前几个方差最大的主成分。

(二)主成分分析法的步骤

(1)将原始数据进行标准化处理,以消除原始数据在数量级或量纲上的差异。

(2)计算标准化的相关数据矩阵:

灾害损毁土地复垦

(3)用雅克比法求相关系数矩阵R的特征值(λ1,λ2,…,λp)和与之相对应的特征向量 αi=(αi1,αi2,…,αip),i=1,2,…,p。

(4)选择重要的主成分,并写出其表达式。

主成分分析可以得到P个主成分,但是由于各个主成分的方差与其包含的信息量皆是递减的,所以在实际分析时,一般不选取P个主成分,而是根据各个主成分所累计的贡献率的大小来选取前K个主成分,这里的贡献率是指某个主成分的方差在全部方差中所占的比重,实际上也是某个特征值在全部特征值合计中所占的比重。即:

灾害损毁土地复垦

这说明,主成分所包含的原始变量的信息越强,贡献率也就越大。主成分的累计贡献率决定了主成分个数K的选取情况,为了保证综合变量能包括原始变量的绝大多数信息,一般要求累计贡献率达到85%以上。

另外,在实际应用过程中,选择主成分之后,还要注意主成分实际含义的解释。如何给主成分赋予新的含义,给出合理的解释是主成分分析中一个相当关键的问题。一般来说,这个解释需要根据主成分表达式的系数而定,并与定性分析来进行有效结合。主成分是原来变量的线性组合,在这个线性组合中各变量的系数有正有负、有大有小,有的又大小相当,因此不能简单地把这个主成分看作是某个原变量的属性作用。线性组合中各变量系数的绝对值越大表明该主成分主要包含了该变量;如果有几个大小相当的变量系数时,则认为这一主成分是这几个变量的综合,而这几个变量综合在一起具有什么样的实际意义,就需要结合具体的问题和专业,给出合理的解释,进而才能达到准确分析的目的。

(5)计算主成分得分。根据标准化的原始数据,将各个样品分别代入主成分表达式,就可以得到各主成分下的各个样品的新数据,即为主成分得分。具体形式可如下:

灾害损毁土地复垦

(6)依据主成分得分的数据,则可以进行进一步的统计分析。其中,常见的应用有主成分回归,变量子集合的选择,综合评价等。

(三)主成分分析法的评价

通过主成分分析法来评价复垦产生的效益,可将多个指标转化成尽可能少的综合性指标,使综合指标间互不相干,既减少了原指标信息的重叠度,又不丢失原指标信息的总含量。该方法不仅将多个指标转化成综合性指标,而且也能对每个主成分的影响因素进行分析,从而判别出影响整个评价体系的关键因素,并且主成分分析法在确定权重时可以科学地赋值,以避免主观因素的影响。

需要注意的是,主成分分析法虽然可以对每个主成分的权重进行科学、定量的计算,避免人为因素及主观因素的影响,但是有时候赋权的结果可能与客观实际有一定误差。因此,利用主成分分析法确定权重后,再结合不同专家给的权重,是最好的解决办法。这样可以在定量的基础上作出定性的分析,通过一定的数理方法将两种数据结合起来考虑。

层次分析法:

主成分分析和层次分析两者计算权重的不同,AHP层次分析法是一种定性和定量的计算权重的研究方法,采用两两比较的方法,建立矩阵,利用了数字大小的相对性,数字越大越重要权重会越高的原理,最终计算得到每个因素的重要性。

主成分分析

(1)方法原理及适用场景

主成分分析是对数据进行浓缩,将多个指标浓缩成为几个彼此不相关的概括性指标(主成分),从而达到降维的目的。主成分分析可同时计算主成分权重及指标权重。

(2)操作步骤

使用SPSSAU进阶方法-主成分分析。

如果计算主成分权重,需要用到方差解释率。具体加权处理方法为:方差解释率除累积方差解释率。

比如本例中,5个指标共提取了2个主成分:

主成分1的权重:45.135%/69.390%=65.05%

主成分2的权重:24.254%/69.390%=34.95%

如果是计算指标权重,可直接查看“线性组合系数及权重结果表格”,SPSSAU自动输出了各指标权重占比结果。其计算原理分为三步:

第一:计算线性组合系数矩阵,公式为:loading矩阵/Sqrt(特征根),即载荷系数除以对应特征根的平方根;

第二:计算综合得分系数,公式为:累积(线性组合系数*方差解释率)/累积方差解释率,即上一步中得到的线性组合系数分别与方差解释率相乘后累加,并且除以累积方差解释率;

第三:计算权重,将综合得分系数进行归一化处理即得到各指标权重值。

文章标签: # 成分 # 分析 # 变量