
如何通过信度的分析来检查测验的质量
一、考试基本情况的分析。
考试基本情况分析要说明本次考试是什么类型、考试的年级、参考的人数、什么范围的考试,考试的目的是什么,试题由什么人命题等有关介绍。
二、试卷质量分析。
试卷质量分析包括试⑴试卷结构分析;⑵试卷的难度、区分度、效度、信度的分析(一般考试只分析难度与区分度);⑶试卷的特点。
1、试卷结构分析:试题结构包括两方面:一是内容结构,即各部分内容占试卷的比重或知识点及分值;二是题型结构,即各类题型的题量和分值比重。
2、试卷难度、区分度、效度、信度的分析:就是通过学生成绩的数据统计分析来衡量试卷的质量,也就是我们常说的抽样调查分析。
这里就试卷的难度与区分度加以说明。
试卷难度与区分度都是相对于某道题来说的,所有题目的平均难度与区分度就是整个试卷的难度与区分度。
①难度:难度是指测验试题的难易程度。
客观题的难度一般用正确回答试题的人数与参加测验的总人数的比值来表示,其公式为P=R/N,其中P代表试题难度,R代表答对试题人数,N代表参加考试测试人数;主观题的难度一般用参加测试考生在这题的平均得分与该题的分值的比,其公式为P=x/w,其中P代表试题难度,x表示所有考生在该题的平均得分,w表示该题所占分值(上面的计算都是以样本为基数)。
由此可知,难度是试题对学生知识和能力水平的适合程度的指标,是一个相对概念,难度的高低与被试人员的水平直接相关,难度的取值范围为0-1,当P=0时,试题的实际困难程度最大,当P=1时,试题的实际难度最小。
高于0.7为较易题,低于0.4则为难题,在一般的教学质量检测中,一份试卷的平均难度应在04-0.7之间,只有适中的难度,才能使试题产生区分不同程度考生的最大效果。
②区分度:它是指某题对不同水平的考生加以区分的能力,区分度是指测验对考生水平的区分程度。
比如答某题时,水平高的学生的高分,水平低的学生的低分,就说明该题的区分度较高。
具有良好区分度的测验,实际水平高的该得高分,实际水平低的应该得低分,它是评价试题质量,筛选试题的主要指标和依据。
区分度的计算方法有许多种,用不同的计算方法的得到结果会不同但是都能说问题:方法一、用高分组与低分组难度差表示。
把所有考生的得分从高到低依次排列,从高分端取27%的考生作为高分组,从低分端取27%的考生作为地分组,分别计算出某题的难度p高p低,两者的差就是该题的的区分度。
计算公式P高-P低,其中D表示区分度,P高表示高分组难度, P低表示低分组的难度。
其二、是高分组的平均分减去地分组的平均分处以该题的最该得分。
D=X高-X低\\\/L。
其中D表示区分度,X高表示高分组平均得分,X低表示低分组平均得分,L表示该题最高得分。
其三、高分组总分减去地分组总分除以该题最高得分与最低的分的差的样本倍数,计算公式:D=S高-S低\\\/N(H-L),S高表示高分组的总分S低表示地分组的总分,N表示样本数,H表示该题的最高得分,L表示该题的最低得分。
区分度的评价标准如下表: 0.40以上 非常良好 0.30--0.39 良好、如能改进更好 0.20--0.29 一般题,需作改进 0.19以下则为劣质题、必须淘汰或改进 3、试卷的特点。
就是对试卷进行总体上的概括,概括其优点、特色和新颖之处,同时要指出试卷的存在的问题,或者提出自己合理的建议。
三、学生考试成绩的分析。
学生考试成绩的分析包括⑴平均分、合格率、优秀旅、最高分、最低分、标准差的计算;⑵分数段频率分布图的绘制或频数分布图绘制;⑶学生答题的失误分析。
学生考试成绩的分析是评价学生成绩高低的依据,也是衡量教师教学质量好坏的重要依据。
①平均分、合格率、最高分、最低分、标准差这些数据可以在excel中可以到快速的计算。
下面就利用excel软件计算有关数据就已说明; 类别一:“平均分”点击统计中的“AVERAGE”(参数算术平均数) 类别二:“及格率”选定一列数据后输入公式:COUNTIF(D3:D15),“>=60”)\\\/COUNT(D3:D15)即可以求出。
(假定以D列从D3到D15的数据,优秀率改为>=85)类别三:“最高分”点击统计中的“MAX”(一组数值中最大值) 类别四:“最低分”点击统计中的“MIN”(一组数值中最小值) 类别五:“标准差”是反映学生成绩离散趋势的指标,表示学生成绩的分化程度,点击统计中的“STDEVP”(给定样本总体标准偏差) ②分数段频率分布图的绘制可以先计算出每个分数段人数(频数)的频率,横坐标为分数段,纵坐标为分数段的频率,然后就可以标点连线制成曲线统计图。
频数分布图就是横坐标为分数段,纵坐标为频数,直接把频数标上连线既可以制成频数分布图。
如果对excel软件操作熟练,可以利用excel软件制作出精美的频率或频数统计图。
不论是频率统计图还是频数统计图都是通过查看分布状态来衡量整体考生的成绩分布状况。
③学生答题的失误的分析。
通过抽样找到普遍存在的答题失误现象,分析学生造成错误的原因,推测试卷的问题或者教学的失策,进而指导今后的教学。
四、今后教学建议。
通过这次考试成绩与试卷的分析,对今后教学有什么启示,主要是从学科特点上、教师的教法上、学生学法特点上去思考今后的教学方向和侧重。
对考试反映出来的普遍问题一定要引起重视,对有借鉴意义的优点也要总结发扬。
什么是信度和效度
如何提高测验的信度和效度
信度是指测验结果的一致性、稳定性及可靠性,一般多以内部一致性来加以表示该测验信度的高低。
信度系数愈高即表示该测验的结果愈一致、稳定与可靠。
系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性。
反之,随机误差可能导致不一致性,从而降低信度。
效度(Validity)即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度。
效度是指所测量到的结果反映所想要考察内容的程度,测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。
效度分为三种类型:内容效度、准则效度和结构效度。
提高测验信度的方法 : ( 1 )适当延长测验的长度 : 测验的长度主要指量表所包含的题目多少。
对一个测验来说 , 测验的题目越少 , 得分越容易受偶然因素的影响 , 故测验的信度越低。
反之如果测验题目较多 , 即测验长度延长 , 扩大了被试得分范围 , 可在一定程度上排除偶然因素的影响 , 从而提高测验信度。
但是测验信度的增加并不是等比例提高信度系数。
当信度系数较小时 , 延长测验长度信度系数增加较大 ; 当信度系数已经较大时 , 延长测验长度对信度系数的影响就较小了。
而且 , 在延长测验长度时 , 还需考虑其他因素的影响 , 如被试在回答问题时是否疲倦或产生厌烦情绪 , 是否节省时间、物力和财力 , 测题是否附合测验目的等。
( 2 )测验的难度要适中 : 难度即测验的难易程度 , 当测验难度太大时 , 被试得分普遍太低 , 呈负偏态分布 ; 当测验难度太小时 , 被试得分普遍较高 , 呈正偏态分布。
太难太易的测验都使被试得分差异减小 , 使实得分数方差减小 , 从而降低测验信度。
( 3 )测验的内容尽量同质 : 性质相同的测验内容 , 对被试也要求相同的能力、知识和技能 ; 而内容不同质的测验 , 则要求被试不同的能力、 知识和技能。
因而为了提高测验信度 , 测验内容应尽量同质。
( 4 )测验的时间要充分 : 对某一测验而言 , 应保证绝大多数被试在规定时间内完成测验 ; 否则 , 如果被试不能从容回答所有问题 , 就不能反映被试的真实水平。
( 5 )测验的程序要统一 : 包括测验的题目统一 , 指导语、 回答问题的方式、分收试卷的方法、测验时间等都要统一。
( 6 )评分要客观 : 评分是否客观对测验信度有直接的影响。
对于客观性题目 , 评分标准明确 , 评分容易做到客观 ; 但对于主观性题目 , 受评分者影响较大 , 不易做到客观。
为了尽可能客观评分 , 应制定明确而易掌握的评分标准 , 尽量做到一卷多评 , 或一人只评一题等。
提高测验效度的方法 : ( 2 )控制系统误差 : 系统误差是影响测验效度的主要因素。
它主要包括仪器不准 , 题目和指导语有暗示性 , 答案按排不当 ( 被试可以猜测 ) 等 , 控制这些因素可以降低系统误差 , 提高效度。
(2) 精心编制测题和测验量表 : 首先测题内容要适合测验目的 , 如知识性测题就不能全面反映被试的智力水平 , 它主要测量其知识水平。
其次 , 测题要清楚明了 , 用语要让被试理解 , 排列由易到难。
第三 , 测题的难度和曲分度要合适。
(3) 严格按照测验程序进行测量 , 防止测量误差 : 要严格按照测验手册进行测量 , 不能作过多的解释 , 按标准评分 , 两次测验间隔要适当。
(4) 样本容量要适当 : 当样本容量增大时 , 样本对总体的代表性提高 , 样本大 , 被试的内部差异增大 , 扩大了真分数的方差 , 使效度提高。
样本容量一般不应低于 30 。
另外 , 抽样方法也很重要 , 一般用随机抽样 , 当群体很大时 , 可分层抽样 , 样本容量扩大时 , 其代表性才随之增大。
(5) 正确处理好信度与效度的关系 : 信度是效度的必要条件 , 但信度高的测验 , 效度不一定高 ; 而效度高的测验 , 信度却比较高。
但是 , 既要有高效度 , 又要有高信度是不容易做到的。
“最大可靠度(信度)要求测验项目之间有高度的组间相关; 最大预测有效度却要求低度的组间相关。
最大可靠度(信度)要求项目等同的难度; 最大预测有效度却要求项目的难度有所区别。
中等程度的组间相关( 0.10 ─ 0.60), 通常可产生良好的效度 (0.30 ─ 0.80), 并且产生满意的信度 (0.90) 。
” ( 郝德员 : 《教育与心理统计》 , 教育科学出版社 ,1962 年版 .P429) (6) 适当增加测验的长度 : 增加测验的长度可提高测验的信度 , 也可以提高效度 , 但增加测验的长度对信度的影响大于对效度的影响。
如果增加测验 长度到原来的 n 倍 。
教育心理学心得体会
作为一个教育工作者,应该懂得一定的心理学知识。
原苏联教育心理学家苏霍姆林斯基曾说过,不懂心理学的教师不是好教师。
教师必须具备相应的心理学知识与运用心理学知识解决教育问题的基本能力,如判断学生是否热爱学习以及引导学生学习的能力,这就需要理论的支持,即人的学习动机分析理论。
因为首先,教师是文化的传递者。
“师者,所以传道、授业、解惑也”,这是从知识传递的角度来反映教师的重要性。
其次,教师是榜样。
学高为师,身正为范,学生受教育的过程是人格完善的过程,教师的人格力量是无形的、不可估量的,教师要真正成为学生的引路人。
第三,教师是管理者。
教师要有较强的组织领导、管理协调能力,才能使教学更有效率,更能促进学生的发展。
第四,教师要富有爱心,作为一名教师,对学生的爱应是无私的、平等的,就像父母对待孩子。
教师还要善于发现每一个学生的闪光点和发展需要。
最后,教师是学生的心理辅导者。
因此,教师必须要懂得一定的心理学,应了解不同学生的学习心理特点,选择科学合理的、适合本班学生的学习策略,并在上课过程中多加思考,适时改进教学方法和策略,以艺术的眼光去对待教学,争取精益求精。
在新课程改革的背景下,一定要认真地贯穿新的教学理念,以学生发展为本,以新的教学姿态迎接新的挑战,使学生的身心都能得到健康的发展。
高尔基曾经说过:“只有满怀自信的人,才能在任何地方都怀有自信沉浸在生活中,并实现自己的意志。
” 这次学习,使我对未来的工作更加充满信心。
微信运营的职责是什么
“两学一做”学习心得休会岳增强我局在认真开展两学一做活动后,本人按学习计划重点学习了党章的内容,通过学习本人的心得体会如下:通过对新党章反复的学习和思考,我尤其对党员应具备的素质,应履行的义务,应享有的权利,应承担的责任有了进一步的明了和定位,对党员的先进性要求有了更加清晰具体的理解,自己的思想理念也得到了新的激发和升 通过对党章的学习,我认识到:我们每个党员要认真学习和遵守党的章程,永葆先进性和争当合格党员,还应努力做到以下三点 一、努力把干好工作和提升自身素质统一起来。
要在干好本职工作的过程中,努力通过深化认识,思考归纳,概括升华,使自己在工作中获得的经验思想、心得体会等成为自身业务水平和思想道德素质的有机构成部分,从而推动自身素质不断得到提高,为与时俱进,不断适应新形势、新情况、新工作。
二、保持与时俱进的精神状态,善于学习尤其是向群众学习,向实践学习,向同行学习,主动接受先进的知识和经验。
当前,经济正处于跨越式发展阶段,民事纠纷、土地征用补偿、涉法涉诉信访等影响稳定因素突出,面对复杂形势,我们必须提高做群众工作的能力,提高执法水平。
学习,只有不断的学习,才能提高我们的工作能力,这是时代的要求,是党对我们的要求。
三、努力把坚守宗旨信念和开拓创新统一起来。
党章第一章第三条要求全体党员还应履行以下义务:“坚持党和人民的利益高于一切,个人利益服从党和人民的利益,吃苦在前,
工作心得体会怎么写
个人工作心得体会通过这几年努力地工作和不断的学习,我获益良多。
其中有硕果累累的喜悦,也有遇到困难和挫败时的惆怅。
工作中让我接触到了许多不同的人和事,不但丰富了我的工作经验,也在处理着各种复杂问题中历练自已。
同时我感谢那些真心教育我、帮助我进步的每一位领导和同事。
让我保持一颗积极向上、决不言弃的心不断发挥自身的潜能量,使我变得更干练,更成熟。
因为我知道,铁不打不成钢,人不磨不成材。
我们作为单位的一员,就必须具备吃苦耐劳的工作精神,以单位的利益为中心,端正工作态度,不为失败找理由,要视结果为导向.勇于付出,敢于拼搏,才能蓄势待发的朝着更高、更远的目标前进。
现将工作总结如下:一、工作方面。
在工作上,虽然一个人的能力有大小之分,天分有高低之分,悟性有好坏之分,但它决定不了一个人的命运。
最重要的是勤能补拙。
日常工作是繁琐的,却体现着一名工作人员的三颗心—细心、耐心、责任心。
除了三颗心之外,更需要我们良好的执行能力、领悟能力、组织协调能力、应变能力,这样才能使工作有的放矢,重点突出,保证效率。
我总结要以高度的主人翁精神,树立时间、速度和质量相统一的效率观念。
做到大事不误,小事不漏。
争取在定量的时间里做出更多、更好的事情来。
“不积跬步,无以至千里:不积小流,无以至江海”。
要以焕然一新的面貌努力工作,用自已的实际行动把每一件工作都办好、办落。
我相信只要辛勤的付出,就是一定会有收获的那一天。
什么是信度 效度 举例说明
一、信度分析 信度(Reliability)即可靠性,是指采用同一方法对同一对象进行调查时,问卷调查结果的稳定性和一致性,即测量工具(问卷或量表)能否稳定地测量所测的事物或变量。
信度指标多以相关系数表示,具体评价方法大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。
信度分析的方法主要有以下四种: 1、重测信度法 同样的问卷,对同一组访问对象在尽可能相同的情况下,在不同时间进行两次测量。
两次测量相距一般在两到四周之内。
用两次测量结果间的相关分析或差异的显著性检验方法,评价量表信度的高低。
2、折半法。
折半法是将上述两份问卷合成一份问卷(通常要求这两份问卷的问题数目相等),每一份作为一部分,然后考察这两个部分的测量结果之间的相关性。
3、折半信度法 折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。
折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。
这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。
在问卷调查中,态度测量最常见的形式是5级李克特(Likert)量表。
进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数(rhh,即半个量表的信度系数),最后用斯皮尔曼-布朗(Spearman-Brown)公式: 求出整个量表的信度系数(ru)。
4、α信度系数法 Cronbach α信度系数是目前最常用的信度系数,其公式为: 其中,K为量表中题项的总数, 为第i题得分的题内方差,为全部题项总得分的方差。
从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于内在一致性系数。
这种方法适用于态度、意见式问卷(量表)的信度分析。
二、效度分析 效度(Validity)即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度。
效度分为三种类型:内容效度、准则效度和结构效度。
效度分析有多种方法,其测量结果反映效度的不同方面。
常用于调查问卷效度分析的方法主要有以下几种。
1、单项与总和相关效度分析 表面效度(Face Validity)。
也称为内容效度或逻辑效度,指的是测量的内容与测量目标之间是否适合,也可以说是指测量所选择的项目是否“看起来”符合测量的目的和要求。
主要依据调查设计人员的主观判断。
这种方法用于测量量表的内容效度。
内容效度又称表面效度或逻辑效度,它是指所设计的题项能否代表所要测量的内容或主题。
对内容效度常采用逻辑分析与统计分析相结合的方法进行评价。
逻辑分析一般由研究者或专家评判所选题项是否“看上去”符合测量的目的和要求。
统计分析主要采用单项与总和相关分析法获得评价结果,即计算每个题项得分与题项总分的相关系数,根据相关是否显著判断是否有效。
若量表中有反意题项,应将其逆向处理后再计算总分。
2、准则效度分析 准则效度(Criterion Validity)。
又称为效标效度或预测效度。
准则效度是指量表所得到的数据和其他被选择的变量(准则变量)的值相比是否有意义。
根据时间跨度的不同,准则效度可分为同时效度和预测效度。
准则效度分析是根据已经得到确定的某种理论,选择一种指标或测量工具作为准则(效标),分析问卷题项与准则的联系,若二者相关显著,或者问卷题项对准则的不同取值、特性表现出显著差异,则为有效的题项。
评价准则效度的方法是相关分析或差异显著性检验。
在调查问卷的效度分析中,选择一个合适的准则往往十分困难,使这种方法的应用受到一定限制。
3、结构效度分析 建构效度(Construct Validity)。
是指测量结果体现出来的某种结构与测值之间的对应程度。
结构效度分析所采用的方法是因子分析。
最关心的问题是:量表实际测量的是哪些特征
在评价建构效度时,调研人员要试图解释“量表为什么有效”这一理论问题以及考虑从这一理论问题中能得出什么推论。
建构效度包括同质效度、异质效度和语意逻辑效度。
有的学者认为,效度分析最理想的方法是利用因子分析测量量表或整个问卷的结构效度。
因子分析的主要功能是从量表全部变量(题项)中提取一些公因子,各公因子分别与某一群特定变量高度关联,这些公因子即代表了量表的基本结构。
通过因子分析可以考察问卷是否能够测量出研究者设计问卷时假设的某种结构。
在因子分析的结果中,用于评价结构效度的主要指标有累积贡献率、共同度和因子负荷。
累积贡献率反映公因子对量表或问卷的累积有效程度,共同度反映由公因子解释原变量的有效程度,因子负荷反映原变量与某个公因子的相关程度。



