第一章
测量结果精确的程度
信度
- 测验结果的可靠性程度
效度
- 所测特性的真实性程度
难度
- 测题的难易水平
区分度
- 测题对被试的区分程度
- 不同量表适用的分析方法
数的特征 | 区分性 | 序列性 | 等距性 | 可加性 |
---|---|---|---|---|
参照点 | 无 | 无 | 相对参照点 | 绝对参照点 |
单位 | 无 | 无 | 相对单位 | 绝对单位 |
测量水平 | 类别测量 | 等距测量 | 等距测量 | 比率测量 |
量表类型 | 称名量表 | 顺序量表 | 等距量表 | 比率量表 |
适用的统计方法 | 频次统计,百分比,众数,异众比率,列连相关卡方检验 | 中位数,百分位差/四分位差,斯皮尔曼等级相关,肯德尔W系数秩和检验 | 平均数,标准差/方差,积差相关,回归分析,T检验和F检验 | 几何平均数,相对差异量 |
心理测量
定义
- 根据心理学的法则在测验上对人的心理特质和教育成就进行定量描述的过程
特点
法则是理论
- 不统一,不成熟,不精确
对象是特质
- 内隐,抽象,间接
结果精确度不高
- 没有相等单位,无绝对零点
- 心理测量只是等级测量
理论基础
- 心理特质具有内隐性
- 心理现象可以测量
心理测验
定义
- 对行为样本的客观的和标准化的测量
- 一个或一群标准的刺激,用以引起人们的行为,根据此行为来估计其心理特征
与相近概念的区别
心理测验
- 名词,工具
心理测量
- 动词,活动,过程
心理评估
- 包括但不限于心理测量
心理测验的三要素
行为样本
- 从行为域中抽取出来的,作为直接测量对象的行为样品
标准化
- 指测验的标志,实施,积分以及测验分数解释程序的一致性
常模/客观性
- 测验不受主观支配,测量方法可以重复,测验的实施,积分和解释都是客观的
心理测验的要素
参照点
- 测量的原始起点
绝对参照点
- 0表示无,没有
相对参照点
- 0人为定的
单位
- 测量的基本要求
- 确定的意义
相等的价值
- 等距性
- 心理测量无绝对参照点也无单位
第二章
中国古代心理测量的思想
- 承认心理的差异性
- 心理差异的可测性
心理测量的实践
- 科举制
西方心理测量的产生
世界上第一份心理测量量表
- 1905
- 比奈-西蒙智力量表
第三章 经典测量理论的基本假设
误差
定义
在测量过程中,与测量目的无关的因素引起的不准确不一致的测量效应
- 取决于研究目的
- 表现为不准确或不一致
分类
抽样误差
- 由于抽样变动造成的误差
- 与样本有关,与测验无关
系统误差
- 由于测量目的无关的因素所引起的恒定的,有规律的变化,存在于每次测量中
- 与效度有关,与信度无关
随机误差
- 由于测量目的的无关的偶然的因素引起的,使得测量结果产生无系统的,随机的不一致,其大小与方向变化完全是随机的
- 既与信度有关,又与效度有关
来源
测量工具
题目取样不当
- 太少或缺乏代表性
题目格式不妥
- 引起被试猜测
- 题目难度过高或过低
- 题目或指导语用词不当
- 时限过短
测量对象
- 动机
- 焦虑
- 生理因素
- 学习,发展和成熟
- 测验经验
施测过程
- 物理环境
- 主试方面
- 意外干扰
- 评分记分
真分数理论及其基本假设推论
真分数
- 指测量中不存在测量误差时的真实值或客观值
- 通过无数测测量的平均值来估算
- T
- 实测分数X
- 误差分数E
X = T + E
- T稳定不变,X的变化取决于E
三个基本假设
- $\bar{E}=0$
- $r_{ET}=0$
- $r_{E_iE_j}=0$
推论
- $S_X^2=S_T^2 + S_E^2$
第四章 信度
概念
- 多次测量结果的稳定性和一致性程度
三个等价定义
- 一组测验分数中,真分数方差与实测分数方差的比率
- 一组测验分数中,真分数与实测分数的相关系数的平方
一组被试在两平行测验上实测分数的相关系数
- 操作性定义
平行测验
- 测验的内容和形式相同
分布一直
- 平均数相等
- 方差相等
作用
反映随机误差的大小
- 系统误差不影响测量结果的一直,与信度无关
- 信度越高,随机误差越小
- 估计真分数
- 比较不同测验的分数
估计方法
重测信度
- 稳定系数
- 用同一测验对一组被试在不同时间测量两次所得结果的一致性程度
前提条件
- 所测量心理特征是稳定的
遗忘和练习的效果互相抵消
- 间隔1~4周
- 在间隔期内,被试的心理特质没有获得更多的学习和训练
缺点
- 受练习和记忆的影响
复本信度
- 等值系数
- 一组被试在两个平行测验上所得结果的一致性程度
- 一组被试的平行测验分数的相关系数
平行测验
- 用不同的题目测量同一的内容,测验结果的平均值和标准差都相同的两个测验,又互称复本
缺点
- 记忆和练习的效果无法完全消除
- 建立复本非常困难
内部一致性信度
- 同质性系数
前提
- 所有题目测量的是同一心理特质
- 分半法
- 协方差法
评分者信度
- 由多个评分者给一组被试评分,所得分数之间的一致性程度
- 不同的估计方法意义不同,不可互相替代
- 尽可能获得各种信度
影响信度的因素
被试方面
单个被试
- 身心状况,动机,注意力,耐心,作答态度等
- 影响被试心理特质的稳定性
团体被试
被试团体的异质性
- Kelly公式(
- 被试团体的平均水平
测量工具方面
测验题目选取
- 题目取样不当,题目数太少或不全面
- 信度低
难度
太难
- 误差增大,$r_{xx}$降低
太简单
- 分布窄,信度低
- 难度适中,产生最广的分数分布范围
题目的同质性
- 同质性高
- 信度高
长度
- Spearman-Brown通式(
- 长度越长,信度越高
第五章 效度
定义
- 在一侧测量中,所测量的心理特质引起的方差在实测分数方差中所占的比例
- $S_X^2=S_V^2 + S_I^2 + S_E^2$
- 实测分数 =心理特质方差 + 系统误差的方差 + 随机误差的方差
- $r_{XY}^2=\frac{S_V^2}{S_X^2}$
和信度的关系
- 高效度=高信度
- 高信度!=高效度
效度的最大值是信度系数
- $r_{XY}^2属于(0,r_{XX})$
估计方法
内容效度
- 逻辑分析/专家评定法
- 副本法
- 再测法
实证效度
- 相关
- 分组
- 校标二分变量:命中率
结构效度
测验内
- 测验的同质性
- 内容效度
- 作答时的反应过程
测验间
- 相容效度
- 区分效度
- 多质多法
- 实证效度
因素分析法
- 探索性因素分析
- 验证性因素分析
影响因素
- 影响误差的因素
- 影响信度的因素
样本
代表性
- 高,高
规模
- 大,高
异质性
- 大,高
校标
- 校标测验的信度
- 测验与校标之间的真正相关程度
第六章
难度的估计方法(答对的百分比
- 二值计分
- 非二值计分
- 分组法
- 难度系数的矫正(
区分度的估计方法
- 项目鉴别指数
- 分组法
- 相关法
区分度跟难度信度的关系
两个层次
项目
- 难度
- 区分度
测验
- 信度
- 效度
区分度和信效度
- D高,$r_{XY}^2$高
- D高,$r_{XX}$高
区分度与难度
P = 1 或 P = 0
- D=0
P=0.5
- $D_{max}$ = 1
- 中等难度的项目区分度最高
第七章
理解目标参照测验和常模参照测验差别
常模参照测验
关注点
- 个体差异,个体间比较,相对能力
- 能力,成就,人格,态度等多种心理特质的测量,选拔性考试等
- 适用前几章中信度,效度,难度,区分度估计方法
目标参照测验
关注点
- 受测者能否做到,是否达到预先设定的标准,绝对水平
- 适用于基本学业能力,职业技能,各种证书,诊断测验等
- 信度,效度,难度,区分度估计方法有其特殊性
1 | 目标参照测验 | 常模参照测验 |
---|---|---|
目的 | 将受测者的成绩与预先设定的标准进行比较 | 将受测者的成绩与他人进行比较 |
内容 | 与真实世界相关的很窄的能力 | 非直接相关的广泛的能力 |
条目选择 | 大多数条目具有相同的难度水平 | 条目的难度差异大 |
分数解释 | 得分通常以达到预先设定标准的百分比表示 | 得分通常用标准分数,百分等级或年级当量表示 |
- 不适合用相关系数来评估信效度
难度信效度方法
信度
- 分类一致性
- 方差分析法(Hoyt信度
效度
内容效度(逻辑分析/专家评定法
- 双向细目表
实证效度(决策效度
- 在目标参照测验和校标测验上均通过和均不通过的被试人数百分比
难度
- 不重要
区分度
- 鉴别力指数D
- 个人获得指数DIG
- 相关法
第八章 测验常模
几种常用导出分数
百分等级
标准分数Z
标准分数的变式
Z‘分数
- Z’=aZ+b
T分数
- T=10Z+50
离差智商
- DIQ=15Z+100
分数合成的方法
- 直觉合成
求和
- 直接求和
- 标准分数求和
- 加权求和
多重回归
- 回归方程
- 决定系数R^2^
多重划分
- 每个特质都单独
- 编制过程(了解
常用常模
- 发展性常模
商数
- 比率智商
- 教育商数
百分等级常模
- 转化表
标准分数常模
- Z或T
- 剖析图
第九章 智力测验
韦氏儿童智力测验
每个分领域含义
- 言语理解
- 知觉推理
- 工作记忆
- 加工速度
分测验含义
- 10核心分测验
- 4补充分测验
- 结果报告
- 瑞文测验
智力理论(了解
两因素论
- 一般因素
- 特殊因素
多因素论(7
- 空间能力S
- 计数能力N
- 言语理解V
- 词汇流畅性W
- 记忆能力M
- 推理与归纳能力R/I
- 知觉速度P
三维结构模型
- 内容
- 操作
- 结果
- 流体智力和晶体智力
- 层次理论
- PASS模型理论
智力表现方法及其优缺点
- 智商IQ
智领
- 每道测题代表两个月的智领
- 比率智商
离差智商
- 在同年龄组中的标准分
第十章 人格测验
- 明尼苏达多项人格MMPI
- 16PF
- 艾森克人格问卷EPQ
大五
- 开放性
- 尽责性
- 外倾性
- 宜人性
- 神经质
投射类测验(了解
- 罗夏墨迹测验
- 心理健康
- 职业兴趣
- 态度
项目反应理论
- 基本原理
- 项目特征函数及其含义