本文档详细介绍了经典测验中测验项目分析的限制和计算方法。
Canvas 提供测验题目的分析统计数据。下载题目分析的逗号分隔值 (CSV) 文件,可以帮助教师和课程设计者评估测验题目的有效性。测验分析会评估选择题和判断题的信度、难度和区分度。
项目分析可能无法在特定测验中生成结果。以下是分析报告中需要考虑的一些局限性。
- 目前的分析功能是针对向所有学生提供相同题目的测验而设计的。因此,如果您为从题组中提取题目的测验生成项目分析 CSV 文件,则该 CSV 文件将生成一行,分别代表测验的每个版本。
- 目前测验项目分析报告仅支持选择题和判断题。
- 如果测验允许多次尝试,计算结果只会考虑学生的第一次尝试(以排除练习效应)。
- 未作答或留空的题目在计算考试总分时计为错误,但不计入单题得分计算。
- 统计数据仅包含尝试参加测验的学生的成绩。
Canvas测验题目的分析基于克朗巴赫α系数生成分数。克朗巴赫α系数衡量一组题目的内部一致性,即一组题目之间的关联程度。只要测验包含两个或两个以上题目,且测试方差大于零,Canvas就会生成α系数。方差大于零意味着两次或多次提交的测试结果可能不同。
笔记: 为了保持最佳的赛道性能在 Canvas 界面中计算的最大值为 1000 次提交或 100 道题。例如,一个包含 200 道题的测验不会生成统计数据。但是,一个包含 75 道题的测验会生成统计数据,直到测验的尝试次数达到 1000 次为止。
如需查看大于这些最大值的结果,请下载学生分析报告并查看 CSV 文件。
测验分析指标
可靠性
信度是衡量测试内部一致性的指标,也就是说,如果多个问题旨在测量相同的信息,那么受测者会以类似的方式回答这些问题。例如,如果一项测试旨在测量对冰淇淋的喜爱程度,那么喜欢冰淇淋的学生应该同意“我喜欢冰淇淋”和“我过去很喜欢吃冰淇淋”之类的陈述。这些学生也应该不同意“我讨厌冰淇淋”之类的陈述。
困难
难度指数(也称为 p 值)显示了正确回答问题的难度。该指数的计算方法是:答对的学生比例。比例值介于 0 和 1 之间。Canvas 使用点二列分布进行此计算。
点二列
点二列相关系数是一种关联观测到的项目反应的相关系数,尤其适用于一组二分数据,这意味着它可以根据正确和错误回答取多个值。除了正确答案的点二列相关系数外,还需对干扰项/错误答案进行相同的计算(也称为干扰项效率)。理想情况下,所有错误答案对答错的学生的吸引力应该相同。该项得分范围为-1到1。
歧视
判断题和选择题的测验统计数据包含一个项目区分度指数,该指数旨在考察分数分布情况,反映学生成绩的差异。该指标衡量单个问题区分考试成绩好坏学生的能力。它根据学生在整个测验中的得分将他们分为三组,并按答对题目的学生人数进行分组。学生分组通常分为前 27%、中间 46% 和后 27%。理想情况下,考试成绩好的学生应该能答对这道题。如果学生整体考试成绩好,但该题答错了,则可能需要修改题目本身。
区分度得分低于+0.24即为较低分值;高于+0.25即为良好分值。理想的区分度指数应体现为:测验得分较高的学生答对题目,测验得分较低的学生答错题目,而得分处于中间范围的学生则答对或答错题目。区分度指数为零则表示所有学生答对或答错题目的结果相同。
CSV 信息
CSV 下载文件还提供了以下计算结果和计数:
- 问题 ID
- 问题标题
- 回答的学生人数
- 顶尖学生人数(排名前 27% 的学生)
- 中等水平学生人数(中等水平学生占46%)
- 成绩垫底的学生人数(排名后 27% 的学生)
- 测验题数(测验题总数)
- 答对的学生人数(答对问题的学生总数)
- 答错的学生人数(答错的学生总数)
- 答对学生比例(答对答案的学生比例)
- 答错学生比例(答错的学生比例)
- 答对题目的优秀学生人数(排名前 27% 的答对学生人数)
- 答对的中间学生人数(答对的学生占46%)
- 答对的后27%学生人数(即成绩排名后27%但答对的学生人数)
- (此题得分的)方差
- 标准差(此题得分的标准差)
- 难度指数
- α 分数(整个考试)
- 正确答案的点二列分布(可靠性指标)
- 第一个错误答案或干扰项的二列点(接着是第二个错误答案或干扰项,依此类推)
拥有课程中 SIS 数据读取权限的用户也可以在 CSV 下载文件中查看 sis_id 列。
您也可以通过以下 Canvas 指南访问此资源: