第二课是一个补充教材 一般我们学习因素分析都会先学探索性因素分析 在这一课里我们只会集中讨论探索性因素分析 在第一课里提及的是验证性因素分析 或许有些同学已经学习过探索性因素分析 所以这儿会作一点补充 让对探索性因素分析没有认识的同学作一点了解 简单来说在前一课提及的是验证性因素分析 验证性因素分析CFA 是我们已经知道它的结构 就是题目间可以分为多少个类别 然后每一个类别(因子)跟另外的因子的关系 我们已有少许概念 但是我们做探索性因素分析的时候 我们是没有理论(theory)的 因为我们不知道应该要分多少类 亦不知道应该如何分类 究竟是否把1,2,3题归为第一类 然后把2,8,9题归成第二类 要如何分类我们是完全没有概念的 要是我们完全没有概念就要做探索性因素分析即EFA 即探索性因素分析 传统来说我们做的都是探索性因素分析 就是我们不知道里面有多少个因子 要如何分类 要是我们已经知道理论(模型) 要做的就是CFA,验证性的 就是我们已经有概念、有架构 有一副图画表示我们知道如何分类 要作探索性因素分析 可以用一般软件如SPSS, SAS 亦可以在LISREL环境下完成 例如做探索性因素分析 做PC, Principal Components 即探索性因素分析里的一个常用的主成份分析 一种常用的方法 NC就是我们希望他们总共有6个主成份(components) 有九个题目,最多就只能有九个主成份 在如今的范例中,我们让电脑先做六个主成份 萤幕显示了电脑做的结果 首先电脑会给我们计算Eigenvalue Eigenvalue代表了这个因素能够解释的变异量是多少 因为这是一个标准化的变量 所以九个题目总共的变异量加起来就是九 而第一个因子的值则代表在总变异量内占有2.56 我们说每一个同学回答这些问题时是不同的 而这些不同,就是这些变异 九个题目间的关系的变异 能够capture第一个因子的 就占有2.56 而% Variance就是该Eigenvalue(2.56)在整体内占有的百份比 在这例子就是百份之28.42 第三项就是Cumulative variance 就是累积的变异量 例如第一、二、三个因子加起来是65.06% 即28.42加18.49加18.15 一般来说,当我们决定要保留的因子数目后 如果总变异量太少,如20-30% 例如,要是九个变量的总变异量 能够用少一点的因子数目 如九个题目用三个因子捕捉capture 60-70%的总变异量 就算很好的结果 要是我们用三个因子 就可以反映65.06%的总变异量 一般来说,九个题目加起来的变异量等于9 平均每一个就相等于1 如果某因子的Eigenvalue不能达到1 也即是平均的期望值亦不能达到,因为数值太小 一般来说Eigenvalue大于1 是常用于决定要保留多少个因子 以下我们会做探索性因素分析 在这分析下,我们并不知道有多少个因子 亦不知道它们之间的关系 第一步是先决定要保留的因子数目 要做这决定,可参考Eigenvalue大于1的因子数目 九个题目只需使用三个因子 就可以表达它们间的关系 这儿三个因子能表达共65.06%的变异量 这里的图表示了Eigenvalue特征值 X轴表示这儿有六个因子 第一个因子的Eigenvalue(特征值)是2.5以上 第二个的特征值界乎1.6至1.7之间 第三个的特征值亦是1.5以上 第四个的因子的特征值就变得很少 要决定保留的因子数目就参考Eigenvalue 最少就是期望它能大于1 在这前题下,我们就应该保留三个因子 第二个决定保留因子数目的方法是scree test scree就是山脚下的碎石 我们就看它的斜率 (slope) 在哪个地方接近水平 斜率的变化是比较大的 这就是碎石的位置 就像是山脚下的碎石 要决定碎石的位置 就要参考斜率变化最大的地方 在这里就是大约三至四个因子 从这个scree test 我们可以选择三至四个因子 作为表达九个变量的关系 第三项要考虑的是 究竟应该用三个、四个还是两个因子 我们需考虑用这种题目分类方法之后是否有意义 有时候我们总看不懂这样分类所得因子的意义 就像以数学(Eigenvalue)得出结果建议用三个因子分类 但这个结果的因子难以理解(故不能采用) 总括来说,我们可从Eigenvalue决定要保留多少个因子 第二,scree test亦可以协助我们检查要保留多少因子 第三,不论用以上哪种方法,我们需能够合理地解释我们所得因子的义意 这三点都是我们做探索性因素分析应该留意及考虑的 探索性因素分析是不知道里面有多少个因子 亦不知道它们的关系 因此我们可以用以上三个方式去检查及决定要保留因子的数目