欢迎来到第七课高阶因子分析 (High-order Factor Analysis) 假设我们有一阶因子,是5种能力 需要估计的参数较多, 包括估计5种能力之间的相关 每两个之间有一个相关,因此共有10个相关 研究的课题是它们是否被一个高阶一点的能力因子影响着 才构成它们之间互有相关? 例如我们有5个跟理科有关的科目,如化学、物理、数学、生物、电脑科学等 这五科之间各有相关 研究问题就是它们之间的相关是否由一种能力如科学推理能力影响着 使它们之间互有相关? 从另一个角度出发,这五个科学是否存有一个共通部份 让我们能抽出来变成一个高阶因子? 我们的研究课题就是能否从那些一阶因子当中, 抽出共同部份构成一个高阶因子 而这高阶因子影响着这些一阶因子, 令它们之间有相关 要留意的是,抽出一个高阶因子后, 同时删去一阶因子间的相关 整个模型不再用一阶因子解释 而改为用上一个二阶因子来代表一阶因子当中的关系 因为二阶因子模型的限制较多, 它的自由度亦增加,
但较多的要求使吻合度降低 再重温一遍 二阶因子是比较简单的模型, 它用二阶因子来解释一阶因子之间的关系 但它的要求较高,限制较多 所以一阶因子模型吻合得较好, 二阶因子模型吻合得较差 如何比较两个模型? 要是二阶因子的卡方增加不多(不显著), 这样换取的自由度就是值得的 要是二阶因子的卡方增加很多(很显著) 就代表它吻合得很差, 就是换取了自由度亦不值得 这就说明它不能抽出一个二阶因子来代表一阶因子之间的关系 参考一个实际例题, 是第四课内5个因子的相关 在原来的模型中,5个一阶因子是有相关的 它们共有10个相关 我们想知道这5个相关能否抽出一个二阶因子, 来代表它们之间的相关? 所以我们就删去一阶因子的相关, 并用一个二阶因子取代 这二阶因子影响着5个一阶因子; 要是这影响是存在的,
那5个路径一定很强 要是这5个路径很弱, 就代表这个二阶因子不太成立;
再来一遍 这模型容许一阶因子之间互有相关, 每两个之间有相关 那些相关系数有0.3、0.4,每一个都不一样, 所以它们的弹性较大 因此一阶因子的模型吻合数据较好 二阶因子模型就是把一阶因子当中的共同性抽出来变成一个因子 要是这个因子是存在的,一阶因子之间的所有相关都会被删去 并用上那二阶因子(一阶因子之间的共同性)取代 要是这个因子真的存在,这二阶模型的卡方 不应会变得太差,而是会接近原来的卡方 原来一阶因子的卡方, 二阶因子能换取一些自由度 换取自由度后,卡方又不是变得太差, 就代表这二阶因子(共同部份)真的存在 看看编程方法: 先写DA NI=17代表17个题目;
KM就是输入相关矩阵 17题内选16题做分析; 在第四课内17题题目有1题删去,
所以,有16题保留下来 至于MO指令,NK=1 如今二阶因子被视为X因子,所以只有一个X因子,因此NK = 1 NY = 16代表共有16题; NE = 5代表5个一阶因子 PS就是A, B, C, D, E五个因子没有被解释的部份(残差) 它们都受二阶因子影响; 余下部份就是残差PS = DI 因为因子和因子间再没有相关, 所以PS的非对角线元素全都固定为0 因此看见因子A有0.56的残差,B同样有0.56, 但残差之间却没有相关 TE = DI,FR跟以往一样 这些独特性之间没有相关 GA是二阶因子到一阶因子的关系, 就是X因子去Y因子的关系 GA = FU代表整个矩阵都需要 所有X到Y的路径都需要, 而且全部都容许自由估计 然后PH = ST; PH是X因子之间的相关 但X只有一个因子, 所以PH是X因子的方差 ST就是把它的方差固定为1 再重温一遍: 范例中的二阶因子是X因子,
一阶因子是Y因子 其实整幅图都可以用Y因子, 却不可全部用上X因子 因为如果一阶因子给其他因子指着就不能成为X因子, 被指着时只能做Y因子 所以范例中的A, B, C, D, E一定要用Y因子 二阶因子则可以用Y因子亦可以用X因子去做 如今我们把它当成X因子; 如果用Y因子来进行分析,结果没有分别 要是二阶因子被视为X因子 二阶因子去一阶因子的路径, 全都是X因子去Y因子,所以是GA 范例中共有5个GA 这5个GA相当于:A、B、C、D、E这5个因子 都是二阶因子的指标(或二阶因子这个变量的题目) 要留意NK = 1,但NX却不存在 这里并没有X的题目 所以我们有X因子却没有X题目 X题目是甚么? 这儿A, B, C, D, E已经相当于题目 这5个因子就相当于二阶因子的题目, 我们也需要用上固定方差或固定负荷法 要是用固定方差法就像现在的一样, PH = ST,把它的方差定为1 5个GA就不用被固定, 全都被自由估计;
再往下看看 至于PA LY指令, 首三题属第一个因子,
次三题属第二个因子 第七题(图内的y8),因为删去前面一题, 所以它成为第七题 这题在第四课已改成从属第一个因子, 所以它是(1 0 0 0 0),即归属第一个因子 看看最后三行 每个因子要选一个题目固定下来, 再预设它为数值1,
这部份是固定负荷法 整幅图内,最容易理解是一阶跟题目的关系, 跟以往的CFA是相同的 较难理解的新概念就是二阶跟一阶的关系 切记二阶是没有题目的, 只有NK = 1却没有NX 设定方面可以用固定方差法或固定负荷法 要是如范例中样使用固定方差法, 就把二阶因子的方差固定为1 可以用PH = ST或PH = ST,FI, 再后补VA 1指令 也可以用固定负荷法, 在5个GA中选其中一个固定为数值1,
任何一个GA都可以 要是用固定负荷方法, 就不用PH = ST,而是PH=SY,FR 方差不用被固定,就可被自由估计 我们会发现,范例的二阶模型节省了5个自由度 因为原来有10个相关,现在用5个路径取代这10个相关, 所以节省了5个自由度 卡方没有明显改变, 其他的拟合优度指数都很好 所以二阶因子确实存在,改动是值得的 要是二阶因子不存在, 而我们强制使用二阶因子,
结果的卡方会明显增加 我们会发现,拟合优度指数会变差很多 而且我们看到,二阶和一阶因子的相关很强, 就是0.66, 0.66, 0.66, 0.75, 0.66,
是很强的相关 要是这些GA系数很低, 就说明,二阶和一阶因子没甚么关系 要是原来10个相关之间没有甚么相关, 就不能抽出共同部份 就没有提出二阶因子的需要 此外,当一阶因子只有三个的时候, 再抽一个二阶因子出来 在数学上那二阶模型和一阶模型是等同的 二阶因子用三条路径来取代一阶因子的关系 一阶因子的三个因子本来有三个相关, 所以两组模型之间并没有节省自由度 值得留意的是, 要是三个一阶因子抽出一个二阶因子 模型以外还有其他因子, 使一阶因子要跟它们找出相对关系 如果抽出一个二阶因子, 二阶因子就能用一条路径来表达那个与外关系 倘若三个因子不抽出一个二阶因子, 跟模型外的因子出现关系时 就必须用上三条路径(连系模型外的因子) 模型就较复杂 这些情况可能适合抽出一个二阶因子, 再找出二阶因子和模型外的因子的关系 因为拟合优度指数反映整个模型的拟合度, 所以要是一阶因子的数目不多 举例4个、5个, 抽出一个二阶因子不会对自由度有太大改变 而且整个模型的拟合度改变也不大, 所以不论二阶因子是否确实存在 那一阶模型和二阶模型的拟合度, 相差不会太远 新旧的自由度相差很小,新旧的拟合度也相差不多 所以用这个方法来区分二阶因子是否存在, 可能比较困难 所以对一些一阶因子不多(4-5个)的模型, 要确定二阶因子是否存在是很困难的 再看一个范例 现在有一个研究包括了25个题目, 当中包括语文、数学、英语、历史和地理能力 25题能够抽出5个因子, 5个因子共有10个相关 要是那10个相关存在一个共同能力, 就能抽出一个二阶因子 萤幕显示抽出的二阶因子 结果显示由二阶到一阶的每个路径都很强, 这就证明这二阶因子可能是存在的 我们看到,一阶因子的卡方是464,自由度是265,RMSEA是0.034,TLI是0.91 5个因子间的相关介乎0.41 - 0.5; 要是因子之间的相关太低就无法 抽出二阶因子 二阶因子的拟合度差不多,其卡方是465,比刚才多了1 10个相关用一个高阶因子取代 卡方只增加1,而自由度就节省了5个(270 - 265=5) 因为10个相关用5个路径来代替,所以节省了5个自由度 RMSEA和TLI、RNI都没有显著改变; 所以简单来说,这二阶模型是可取的 这二阶模型确实成立; 另外二阶和一阶的关系亦很强;
BE这些都很强 因为现在用的全是Y因子, 所以所有二阶到一阶的路径全是BE而非GA 现在来一个总结; 在二阶模型内 一阶因子之间的相关, 通常不再容许存在,
所以一阶因子之间的相关全都删去 除了一些特殊情况, 建议抽出二阶模型后 还容许1-2个相关存在于一阶因子; 当然这必须有充份的理由 二阶到一阶的路径, 都是由二阶指向一阶 就像把一阶因子当成题目一样, 由因子指向题目;
所以说由二阶指向一阶 有两个方法计算: 一个是固定负荷法,
另一个是固定方差法 对二阶和一阶之间的关系, 也是用其中一个方法 右图中表示的是固定方差法; 在这方法里,二阶因子的方差被固定为1 这5个二阶到一阶的路, 全都可以自由估计 但也可以用固定负荷法, 就是KSI 1这个二阶因子的方差可以自由估计 但那5个二阶到一阶因子的路(GA或BE) , 要选其中一个固定为1 这就是固定负荷法 至于测量measurement model, 表达一阶因子跟25题题目的关系,
可用传统的固定负荷法 而刚才探讨的是二阶因子和一阶因子之间的关系 可用固定负荷法或固定方差法来处理 对于只有3个或以下一阶因子的模型, 通常不再建构一个二阶因子 因为这情况下的二阶因子模型, 在数学上和一阶因子模型是等同的 但也有特殊情况: 就是有了二阶因子后,
再有跟模型外的一阶因子出现关系 这二阶因子的建构或能节省出自由度 因为模型跟模型外的因子的关系, 全都可以透过二阶因子来表达 甚么时候要二阶甚么时候要一阶? 要是建构了二阶模型后, 二阶模型的自由度比一阶模型大 就代表二阶模型比较简单,较为节省 因为要求较多,所以二阶模型的卡方一般较一阶模型为大 因为二阶模型的限制多,所以它的卡方会较差一点、大一点 要是它变差的程度不大,只是增加了一点, 这个二阶模型就成立了 要是卡方增加很多, 再强制使用二阶模型是不恰当的 这想法并不乎合数据的关系 所以要是卡方增加很多, 就是换取了少许自由度也不足够 所以就作结论,这一阶模型不能成立二阶 在LISREL里要设定这些二阶模型有两个方法 一个是二阶因子用ξ (X因子),一阶因子用η (Y因子) 另一个是所有一阶、二阶因子全都用η (Y因子)来处理