HLM(分层线性和非线性模型)软件是一个用于分析具有层次结构的数据的统计软件。它允许研究人员在单个分析中研究层次结构中任意层次间的关系,
同时考虑到每个层次的变异性。HLM软件能够处理连续、计数、序数和名义结果变量,并提供了多种模型选择,包括两层次、三层次和四层次模型,以及多变量模型和具有相关随机效应的分层模型等。
在社会研究和其他领域,研究数据通常具有层次结构。也就是说,研究的各个对象可能被分类或排列成组,而这些组本身具有影响研究的特性。显然,分析此类数据需要专门的软件。分层线性和非线性模型(也称为多级模型)已被开发出来,允许在单个分析中研究任何级别的关系,同时不忽略与层次结构的每个级别相关的可变性。
HLM 利用每个级别指定的变量,将模型与结果变量进行拟合,生成一个线性模型,该模型具有解释变量,这些解释变量解释了每个级别的变化。HLM 不仅估计每个级别的模型系数,而且还预测每个级别上与每个采样单元相关的随机效应。
高级经理:
●可以适合具有连续、计数、序数和名义结果变量的两级、三级和四级模型。
●能够拟合多元模型,其中层次结构最低级别的方差可以呈现多种形式/结构。
●为横截面和纵向模型提供三级和四级嵌套模型选择,以及为四向交叉分类和嵌套混合模型提供选择。
●允许拟合具有相关随机效应的分层模型(空间设计模型)。
●能够以完全自动化的方式从不完整数据中估计 HLM,该方法从不完整数据中生成并分析多个插补数据集。该模型是完全多变量的,使分析师能够通过辅助变量加强插补。
●包括适合固定截距和随机系数(FIRC)的灵活组合的选项,现在包含在 HLM2、HLM3、HLM4、HCM2 和 HCM3 中。
●可以分析多重插补/合理值数据。
●有一个适合 V-known 模型的选项。
HLM程序包可以处理连续,计数,序数和名义结果变量(outcome varible),及假定一个在结果期望值和一系列说明变量(explanatory variable)的线性组合之间的函数关系。这个关系通过合适的关联函数来定义,例如identity关联(连续值结果)或logit关联(二元结果)。
在社会研究和其他领域,研究数据通常具有层次结构。也就是说,各个研究对象可以被分类或分组,而这些分组本身就具有影响研究的性质。在这种情况下,个人可以被视为一级单位的研究,而他们被安排到的组是二级单位。这个范围还可以进一步扩大,第二级单位分为第三级单位,第三级单位分为第四级单位。这样的例子在教育(1级的学生,2级的教师,3级的学校,4级的校区)和社会学(1级的个人,2级的社区)等领域比比皆是。层次线性和非线性模型(也称为多级模型)的开发是为了在单个分析中研究任意层次的关系,而不是忽略与层次的每个层次相关的可变性。
HLM将模型与结果变量相匹配,结果变量生成一个线性模型,其中的解释变量解释了每一层的变化,利用每一层指定的变量。HLM不仅可以估计每一层的模型系数,还可以预测每一层与每个采样单元相关的随机效应。由于该领域的数据普遍采用层次结构,因此通常用于教育研究,但它适用于任何具有层次结构的研究领域的数据。这包括纵向分析,其中一个个体的重复测量可以嵌套在被研究的个体内。此外,虽然上面的示例意味着这个层次的成员在任何水平的嵌套只在一个成员在更高的层面,高级别还可以提供一个会员情况不一定是“嵌套”,但“交叉”,当一个学生一样可能是各种教室的一员在研究期间的持续时间。
HLM允许连续的、计数的、有序的和名义的结果变量,并假设结果期望与一组解释变量的线性组合之间存在函数关系。这种关系由合适的链接函数定义,例如,identity链接(连续结果)或logit链接(二进制结果)。
由于对多变量结果模型(如重复测量数据)的兴趣增加,Jennrich & Schluchter(1986)和Goldstein(1995)的贡献导致将多变量模型纳入大多数现有的分层线性建模程序中。这些模型允许研究人员研究层次结构中最低层次的差异可以采用各种形式/结构的情况。该方法还为研究人员提供了拟合潜在变量模型的机会(Raudenbush & Bryk, 2002),层次结构的第一层表示易出错的观测数据和潜在的“真实”数据之间的关联。最近在这方面受到注意的一个应用是对项目反应模型的分析,其中一个人的“能力”或“潜在特征”是根据某一项反应的概率作为项目特征的函数呈现给一个人。
在HLM 7中,引入了前所未有的多水平和纵向数据建模的灵活性,包含了处理二进制、计数、序数和多项式(名义)响应变量以及正常理论层次线性模型的连续响应变量的三个新过程。hlm7引入了用于横截面和纵向模型的四层嵌套模型和用于交叉分类和嵌套混合模型的四层嵌套模型,加入具有相关随机效应的层次模型(空间设计)。另一个新特性是通过使用自适应高斯-埃尔米特求积(AGH)和最高似然的高阶拉普拉斯近似来估计层次广义线性模型的新灵活性。AGH方法已被证明在集群规模小且方差组件大的情况下非常有效,高阶拉普拉斯方法需要更大的集群大小,但是允许任意数量的随机效应(当集群大小很大时很重要)。
在HLM8中,增加了从不完整数据估计HLM的能力。这是一种完全自动化的方法,可以从不完整的数据生成和分析多个输入的数据集。该模型是完全多元的,分析人员可以通过辅助变量来强化其归罪化。这意味着用户指定HLM;该程序自动搜索数据,以发现哪些变量有缺失值,然后估计一个多元层次线性模型(“插补模型”),其中所有变量都有缺失。