|
<P>北京大学人事测量串讲笔记(2003年) </P>
<P>人事测量概论</P>
<P>常模是否可靠,关键是有没有一个具有代表性的被试样本。</P>
<P>名词解释</P>
<P>⒈心理测验是心理测量的一种具体方法和手段,它是结合心理学和统计学方法评价特定个体在特定素质上相对于特定群体所处的水平的手段。心理测验是人事测量中最常采用的方法之一。</P>
<P>⒉常模是一组具有代表性的被试样本的测验成绩的分布结构,包括它的集中趋势和离散度。常模是用以比较不同被测者测验分数的标准,它能够说明某一测验结果分数相对于同类被测者所处的水平。</P>
<P>⒊天花板效应:测验题目过于容易,致使大部分个体得分普遍较高的现象。</P>
<P>⒋地板效应:测验题目过难,大部分个体得分普遍较差的现象。</P>
<P>⒌测量的形式和工具根据测量内容的不同而不同。如,需要对应聘营销人员的口头表达、情绪控制等方面进行测查,就不宜采用一般的纸笔测验,而最好采用情境模拟测验,如小组讨论测验。但考虑一般自陈量表(即基于自我评价的问卷)的动机测验题目表面效度(即从题目表面是否容易看出出题人的意向和答案倾向)过高,或应聘者容易表现出较高的社会赞许性,即题目本身的答案反映了一般社会价值倾向,应答者很容易表现出反应偏差,投其所好,故可能不适合于在招聘考核中采用时,就可采用隐蔽性比较高的投射测验来对应试者的动机进行评定。</P>
<P>投射测验是人格测量的工具,考察人格个性特征,通过迂回曲折的方式投射出的个性动机、兴趣等方面。</P>
<P>简答及论述</P>
<P>⒈简述心理测量和人事测量的关系。</P>
<P>⑴心理测量是通过科学、客观、标准的测量手段对人的特定素质进行测量、分析、评价。所谓素质,是指那些完成特定工作或活动所需要或与之相关的感知、技能、能力、气质、性格、兴趣、动机等个人特征,它是以一定的质量和速度完成工作或活动的必要基础。</P>
<P>⑵人事测量是心理测量技术在人事管理领域的应用,它以心理测量为基础,针对特定的人事管理目的如招聘、安置、考核、晋升、培训等,对人的素质进行多方面系统评价,从而为人事管理、开发提供参考依据。相对来说,人事测量是一个更广泛的实用概念,它通常要求运用多种心理测量工具来完成。</P>
<P>⑶心理测量是人事测量的基础。人事测量是以人为对象,是对人的测量,这正是以心理测量为基础进行的。绝大多数人决策都需要以人事测量为基础。如招聘人员时,要测量应聘者的能力、工作动机;考虑晋升时要评价能力是否胜任新的职位;计划培训时要考察对象在哪些方面对于完成规定的工作任务有不足。所有这一切都要运用心理测量。故要从事人事测量,首先要掌握心理测量。</P>
<P>⒉心理测验的五个基本要素。</P>
<P>⑴行为样本。(①行为样本数量必须足够多,以使从样本到总体的推测错误率尽可能最低;②要保证所选择样本的具有对总体样本的代表性)</P>
<P>对个体行为或行为特征的测查无法做到对所有情况面面俱到。在进行心理测量时,往往只能对经过科学选择的少数行为样本进行测查,借以推测个体的心理特征。如要考察个体的数学运算能力,可以选择一定数量有代表性的运算题进行测量。个体对所抽选出来的问题的解决行为就是行为样本。</P>
<P>⑵标准化。</P>
<P>是指测验编制、实施、记分和测验分数解释必须遵循严格的统一的科学程序,保证对所有被测者来说施测的内容、条件、记分过程、解释系统都相同。只有这样才能保证测验的客观性和准确性。</P>
<P>⑶难度的客观测量。</P>
<P>测验题目的难度水平影响到测验的客观性。测验的题目太容易,所有人都成功地完成所有项目,得分都很高,或测验题目太难,使得大部分人的得分很低,都会使所有被测者的反应趋于一致,抹消了个体差异,无法就某一素质将不同的被测者很好地区别开来,致使测验的目的无法达到。</P>
<P>⑷信度。</P>
<P>信度是指测验结果的可靠性、稳定性,即测验结果是否反映了被测者的稳定的、一贯性的真实特征。这种可靠性体现在:</P>
<P>测验结果跨时间的一致性――被测者在不同时间所测结果一致;</P>
<P>测验内容的一致性――同一测验内的各部分题目所测的是同一种行为或行为特征;</P>
<P>不同评分者之间的一致性――不同评分者对同一测验结果的评分一致。</P>
<P>⑸效度。</P>
<P>效度是指所测量到的结果是否反映了所想要考察的内容,也就是说,该测验所测的是不是它想要测的东西。</P>
<P>效度指标主要包括效标关联效度、内容效度和构想效度等。</P>
<P>⒊人事测量的功能与用途。</P>
<P>人事测量的具体功能涉及甄选、安置、考核与培训等几个方面。</P>
<P>⑴甄选。</P>
<P>在人事管理领域,人事测量可以用来对人才进行选拔。人事甄选的一个关键技术问题,是如何预测未来工作的绩效。人事测量恰恰可以为预测应聘者将来的工作行为和绩效提供重要的科学依据。</P>
<P>⑵安置。</P>
<P>通过人事测量,可以对个体的兴趣、人格、能力、技能等多方面进行分析,为实现人才的合理安置提供信息。</P>
<P>⑶考核与培训。</P>
<P>人事测量能够提供关于个体的行为的描述,形成对被测者的全面的评价,从而为人事考核及培训提供依据。</P>
<P>⒋简述人事测量的程序。</P>
<P>确定测量目的</P>
<P>(根据岗位职务任职要求确定检测内容)</P>
<P>↓</P>
<P>确定测量方法</P>
<P>(确定测量的基本形式和测量工具)</P>
<P>↓</P>
<P>实施测量</P>
<P>(测量的实施与数据采集)</P>
<P>↓</P>
<P>分析测量结果</P>
<P>(对采集数据进行统计分析并作出报告)</P>
<P>↓</P>
<P>人事决策与建议</P>
<P>(根据分析作出决策或对决策的建议)</P>
<P>⑴确定测量的目的和内容。</P>
<P>根据不同的测量目的确定具体的测量内容是人事测量的第一步。测量内容应根据所选拔岗位的任职素质要求,通常可以工作分析、职务说明为依据。</P>
<P>⑵确定测量的基本形式和测量工具。</P>
<P>测量的形式和工具根据测量内容的不同而不同。测量形式和工具的确定也是非常重要的一步。不恰当的测量方法会使测量结果不能满足测量目的,甚至会导致收集到虚假信息,误导决策的制定。</P>
<P>⑶测量的实施与数据采集。</P>
<P>在测量的实施过程中,要注意做到客观化、标准化,保证收集到的测量结果能够公平、真实地反映应试者的状况。在收集测量资料的同时,要注意将实施测量的过程中相关的信息及可能决策产生影响的细节记录下来,作为决策的辅助材料。另外,对测量结果造成影响的特殊因素也应进行记录。</P>
<P>通常,要求测量的现场环境要空气通畅、新鲜,照明充足,温度、湿度适宜,干净整洁,安静,没有外界干扰,每个被测者的桌椅应尽可能舒适,并有足够的空间,尤其避免多个被试者同时应试时相互影响、干扰。</P>
<P>⑷分析测量结果。</P>
<P>对测量结果的分析通常包括对测量结果的计分、统计和解释。使用者只需按照测验说明进行*作即可。</P>
<P>⑸根据分析作出决策或对决策的建议。</P>
<P>决策与测量的目的联系紧密,以选拔为目的的测量,其决策内容为候选人名单;以安置为目的的测量,其决策内容为岗位与应聘者的匹配;以评价为目的的测量,其决策内容为对应试者素质的评价;以诊断为目的的测量,其决策内容为应试者的问题和特长或应试团体的状况和管理问题;以预测为目的的测量,其决策内容为应试者将来的绩效和工作表现。</P>
<P>⑹跟踪检验和反馈。</P>
<P>在多数情况下,需要对测量结果及聘用结果进行跟踪,主要是根据工作绩效对测量结果和聘用进行检验,这就为此前的工作提供了重要的反馈,为测量取得经验性资料,为进一步矫正测量以达到更大的精确度提供了依据。可以说,到这一阶段,才真正完成了一个人事测量作业环路。</P>
<P>人事测量的历史</P>
<P>填空及选择</P>
<P>⒈世界上第一个具有应用价值的心理测验,是FaGuo心理学家比奈制定的智力测验。</P>
<P>比奈的智力测验作为最早的评价、鉴定智力的结构和水平的测量工具,是应社会的需要而产生的。</P>
<P>⒉世界上第一个标准化的人格问卷――武德沃斯编制的“个人资料调查表”,鉴别不能从事军队工作的神经症患者。第一个职业兴趣测验――斯特朗男性职业兴趣量表,广泛应用于职业选择、人才选拔。</P>
<P>⒊历史上最著名的职业兴趣测验有斯特朗-坎培尔职业兴趣测验和霍兰德职业兴趣问卷。它们都通过分析确定职业兴趣而分为六大类:社交型、艺术型、研究型、技能型、事务型、经营型。</P>
<P>⒋燕京大学校长陆志韦先生发表了经修订的比奈-西蒙量表,这就是中国最早的标准化的比奈智力测验。</P>
<P>1979年,北京大学心理学系的吴天敏教授对中国的比奈量表进行第三次修订。</P>
<P>二、名词解释</P>
<P>⒈智力包括一切高级的心理过程,并突出表现在推理、判断、问题解决的能力上。</P>
<P>⒉“1905年比奈――西蒙量表”。量表是说心理测验是一种以人的心理为内容的、有一定量度的量具。就是指测量心理的度量工具。</P>
<P>⒊1905年比奈――西蒙量表是一项个体测验,这是相对于团体测验而言的,因为测验是以单一个体为实施对象而设计的。</P>
<P>团体测验能使我们迅速而有效地同时收集到大量测验者的资料。美国心理学家编制了第一个团体智力测验――陆军甲种测验和适用于母语非英语的被试和文盲被试的陆军乙种测验。</P>
<P>团体测验采用多项选择,而个体测验多采用开放式问题、团体测验多采用客观的计算机计分,而个体测验一般为施测者计分、团体测验为团体施测,个体测验为个体施测、团体测验多用于筛选,而个体测验多用于诊断及弥补工作、团体测验标准化样本极大,一般在几十万左右,而个体测验一般只用几千名精心挑选的被试。</P>
<P>⒋智力年龄即为每一个年龄确定出难度最适宜的题目,用被测者所能完成的最大难度的题目所对应的年龄作为该被测者的智力年龄。</P>
<P>实足年龄:自己本身的生理年龄。</P>
<P>⒌时间均匀性:其智力落后的程度不是保持固定的时间程度不变,而是按照一个比例,越来越大。</P>
<P>⒍智商IQ=100X智力年龄/实足年龄。</P>
<P>计算:一个儿童参加了比奈智力测验,他完成了前14题,即智力年龄为5岁,若他的实际年龄4岁6个月,则比率智商IQ=5/4.5*100%=111%。</P>
<P>⒎离差智商:以标准差为单位计算测验分数偏离平均数的方向和程度。</P>
<P>⒏纸笔智力测验:欧提斯编制的,十分适合于团体施测,其中的多项选择题和其他客观题都是首次采用。这项测验最后编制修订成著名的军队α和军队β测验,即陆军甲种测验和陆军乙种测验,前者为文字测验,后者为非文字测验,专门为文盲和不懂英文的新兵设计的。</P>
<P>⒐人事管理思想:⑴工作的绩效和人的素质有关,要追求高的工作绩效,必须有高素质的人才;⑵不同的工作对人的素质结构的要求不同,必须有针对性地为不同的工作匹配不同的人才,才能确保各种工作的高绩效,做到恰当的人做恰当的事。这也就是最经典的“人――事匹配”的思想。</P>
<P>⒑分化能力性向测验:从语言理解、语言推理、数学推理、抽象推理、空间推理、机械推理等六个方面检测人的智力水平,从而整体分析智力结构。</P>
<P>⒒动机是指由特定需要引起的,欲满足该种需要的特殊心理状态和意愿。</P>
<P>⒓一般生活动机是指人们广泛的生活领域中具有普遍性的需求所导致的动机。主要理论有马斯洛的需要层次理论,赫兹伯格的保健-激励理论,奥德佛尔的ERG理论(ERG即生存、关系、成长)。</P>
<P>⒔工作动机是具体指驱使人们工作的原因。麦克里兰提出了三重需要理论:成就动机,即寻求获得成功;权力动机,即寻求获得、保持和运用对他人的影响和支配;亲和动机,即寻求与多数人群保持密切的关系。又提出能力动机,即寻求不断获得、运用和增长才能。</P>
<P>三、简答及论述</P>
<P>⒈简述人格如何影响人?与工作的关系是什么?</P>
<P>人格主要指人所具有的与他人相区别的独特而稳定的思维方式和行为风格。人格同人的工作绩效和工作方式及习惯有关。涉及以下几个方面:</P>
<P>⑴人格会影响人在工作中对事物的理解。</P>
<P>有的人看待事物比较独立,有自己的主见;有的人则很容易受周围人和环境的影响和暗示,判断事物缺乏自己的标准,即场依存性。</P>
<P>⑵人格会影响人处理事物的方法。</P>
<P>有的人处世谨慎,凡事谨小慎微,有的人则不拘小节,放荡不羁,敢于冒险。有的人做事优柔寡断,有的人做事坚决果断等。</P>
<P>⑶人格会影响人在工作中与他人相互沟通的方式。</P>
<P>有的人善解人意,能体察对方心情,有的人则麻木不仁,反应迟钝。有的人善于为对方设身处地地着想,能换位思考,从对方角度看问题,有的人说话善于调侃,调整气氛,有的人说话则过于直率,甚至失于尖刻,易于伤人。</P>
<P>⑷人格会影响人独特的表现方式。</P>
<P>有的人情绪稳定,心气平和,有的人多愁善感,有的人脾气乖戾,喜怒无常。有的人做事我行我素,独往独来,有的人则善于察言观色,或随群附众。有的人做事很讲义气,重情分,有的人则薄情寡义。</P>
<P>由上述可知,不同的人的确会给工作带来不同的结果。这也就要求人事诊断和安置作出相应的考虑并采取相应的方法。</P>
<P>⒉人事测量技术的发展。</P>
<P>⑴出现大量适用于人事管理领域的测验。</P>
<P>Wonderlic人事测验、一般能力性向测验、分化能力性向测验、DISC人格测验等。</P>
<P>⑵面试技术在人才选拔中广泛应用。</P>
<P>面试历来是招聘过程中必不可少的一个过程,企业开始寻求一种客观、公正的面试评估方法,于是,结构化、半结构化的面试在企业大受欢迎,标准化的面试提问表和评分表在招聘中被普遍采用。</P>
<P>⑶人格测验成为人才甄选程序的必要过程。</P>
<P>现代企业开始认识到许多非智力因素,如性格、情绪特质、人际关系技巧、动机、兴趣和态度模式等方面,对工作方式甚至工作绩效都有十分重要的影响。各种对人格进行测量的工具受到企业的欢迎,人格测验成为人才甄选程序的必要过程之一。</P>
<P>⑷针对具体要求的测验设计、组合越来越重要。</P>
<P>由于现代企业对人才素质的要求越来越精细化、多面化,并越来越强调企业自身的特点对人才选拔的要求,人事测量正向迎合具体企业要求和岗位要求的方向发展。于是,在人事测量领域越来越强调针对具体要求设计测验和对测验进行合理组合。</P>
<P>人事测量在企业的人才选拔、培训、考核等领域发挥着重要的作用。随着企业管理科学化的发展,人事测量已成为现代企业人力资源管理的必要工具之一。</P>
<P>人事测量的基本类型</P>
<P>填空及选择</P>
<P>⒈标准化的纸笔类测验的优点:方便性、经济性、客观性。</P>
<P>标准化纸笔测验的不足之处:</P>
<P>⑴受测验的形式所制约,它无法对被测者实际的行为表现进行测量;</P>
<P>⑵纸笔测验的实施较为程式化,我们只能收集到测验中所考察的信息,而对于测验外的信息我们一无所知。</P>
<P>⑶纸笔形式测验中有标准答案的测验如能力测验,并不能完全避免考试技巧和猜测因素的影响。</P>
<P>⒉投射技术一词由富兰克于1939年首先明确提出。</P>
<P>名词解释</P>
<P>⒈纸笔测验就是只用纸和笔就能进行的测验。这类测验在实施过程中,一般不需要借助其他工具和手段。标准化的纸笔测验一般有事前确定好的测验题目和答卷以及详细的答题说明,测验题目往往以客观题居多,但也有不少是主观自陈评价题。有的测验限定时间,有的则不限定时间。一个标准的纸笔测验系统还包括客观的计分系统、解释系统、良好的常模以及值得信服的信度、效度和项目分析数据。</P>
<P>⒉投射测验要求被试对一些模棱两可或模糊不清、结构不明确的刺激作出描述或反应,通过对这些反应的分析来推断被试的内在心理特点。其逻辑假定是,人们对外在事物的看法实际上反映出其内在的真实状态或特征。</P>
<P>⒊公文筐测验是让被试在所安排的假想的情境中扮演某种管理者的角色,对事先设计的一系列文件进行处理,进而针对被试处理公文的方式、方法、结果等进行评价。公文筐测验一般用于对高级管理者的评价,它可以对应试者的计划、预测、决策、沟通等管理能力进行测查,在管理领域应用十分广泛。</P>
<P>⒋面试是考官针对自己感兴趣的、与工作有关的各种问题,与应聘者进行面对面的交谈,收集有关信息,从而达到了解、评价应聘者的目的。</P>
<P>面试按其形式的不同可以分为结构化面试和非结构化面试。</P>
<P>⑴结构化面试往往有事先确定的提问提纲,里面列出需要了解的各方面的问题,而且这些问题通常还可能有一定的内在的逻辑结构。</P>
<P>⑵非结构化面试则没有固定的面谈程序,面谈者提问的内容和顺序都取决于面谈者的兴趣和现场应试者的回答。这种面试方法给谈话双方以充分的自由。</P>
<P>⒌调查法。在人事管理工作中,经常使用的一种测量方法。指就员工的某些意愿、态度、观点或感受等认知性或情感性心理状态或行为倾向,进行一定范围的信息搜集,并就相应状态或倾向的特性、程度、广泛性等作出分析评价,通常由一系列问题构成,可以是纸笔形式,也可以是访谈形式。</P>
<P>简答及论述</P>
<P>⒈投射测验的主要特点。</P>
<P>投射测验的主要特点是它的非结构性、掩蔽性和整体性。</P>
<P>⑴非结构性。指投射测验使用非结构化任务作为测验材料,即允许被试产生各种各样不受限制的反应。</P>
<P>⑵掩蔽性。指测验的目的的隐蔽性,被试一般不可能知道测验的真实目的,也不知道对自己的反应将作何种心理学解释,减少了被试的伪装自己的可能性。</P>
<P>⑶整体性。指测验关注的是对人的总体评估,而不是针对单个特质的测量。</P>
<P>⒉投射测验的分类及实例。</P>
<P>林德塞按照测验所引起的反应性质将投射测验分为五类:</P>
<P>⑴联想法投射测验。</P>
<P>测验任务为报告因某种刺激所引起的联想。罗夏克墨迹测验,测试材料:10张墨迹图,其中5张是黑白的,2张有黑色和红色墨迹,另外3张为淡彩色墨迹图。测验任务:看图片后对图画内容进行自由联想,主试通常问“请告诉我你在图片中看到了什么,或者想起了什么?”回答后主试又将图片展示出来,询问是图片的哪个部分,哪些因素致使被试作出以上联想的。</P>
<P>⑵构造法投射测验。</P>
<P>测验任务为让被试编造或创造一些作品。绘人测验,测验任务:要求被试在一张白纸上用铅笔任意画一个人。画完后,再要求被试画一个与前者性别相反的人。最后,主试可以通过面谈的方式向被试了解他所画人物的年龄、职业、爱好、家庭、社交等信息。最后测验者对被试的作品进行分析。</P>
<P>⑶完成法投射测验。</P>
<P>测验任务为让被试对一项不完整的材料进行填补使其完整,如语句完成法。罗特未完成句子量表,测验任务:要求被试将一系列句干补充成完整的句子。通过被试的反应可以对被试的家庭态度、社会与性态度、一般态度、品格态度进行解释。</P>
<P>⑷选择或排列法投射测验。</P>
<P>测验任务为让被试将一些刺激按照某种原则进行选择或予以排列。可以让被试将一些描述人性格的词按照其好恶程度或适宜程度排序,从顺序中可以分析出被试的人格。</P>
<P>⑸表露法投射测验。</P>
<P>测试任务为让被试利用某种媒介自由地表露自己的心理状态。可以通过书写、谈论、歌唱、绘画等形式让被试自由表达,从中分析其人格。</P>
<P>⒊对投射类测验的评价。</P>
<P>通过投射技术可以使被试不愿表现的个性特征、内在冲突和态度更容易地表达出来,因而在对人格结构、内容的深度分析上有独特的功能。但对于投射测验一直存在相当多的批评:</P>
<P>⑴由于投射测验结果的分析一般是凭分析者的经验的主观推断,其科学性有待进一步考察。</P>
<P>⑵投射测验在计分和解释上相对缺乏客观标准,人为性较强,不同的测验者对同一测验结果的解释往往不同,并且,投射测验的重测信度也很低。</P>
<P>⑶投射技术是否能真正避免防御反应的干扰,在研究上并未得出一致结论。</P>
<P>投射测验除具有上述缺点之外,在应用时还有如下不便之处:</P>
<P>⑴投射测验一般为个体测验,不仅测验时间长,分析结果所需要的时间也很长,实施起来耗费精力。</P>
<P>⑵投射测验对主试和评分者的要求很高,一般只能由经验丰富、有专业背景的人担当。</P>
<P>⑶对投射测验结果的评价带有浓重的主观色彩,不能满足人事测验的公平性原则。</P>
<P>⒋行为观察法。</P>
<P>行为模拟与观察类测量的技术核心是行为观察法,它是通过安排一定的情境,在其中观察特定个体(或群体)的特定行为,从中分析所要考查的内在素质或特征。行为观察法可以分为自然观察法、设计观察法和自我观察法。</P>
<P>⑴自然观察法。是观察者在真实的生活或工作情境中对个体的行为进行直接观察的方法。在企业中,可以尝试在考核中引进客观的自然观察方法。人事经理可以在考核前选定任意一个工作时段,在不被员工发觉的前提下对员工的工作行为进行观察,并作客观详细的记录,该记录资料可以作为考核的依据。</P>
<P>⑵设计观察。一般很难有机会在自然状态下遇到这种观察机会,这就需要采用设计观察法,即在人为设计的环境中观察特定的行为或反应。在人事测量领域经常用的设计观察方法有情境压力测验和模拟情境测验两种。</P>
<P>情境压力测验由主试向被观察者布置一定任务和作业,借以观察个体完成任务的行为。工作样本测验、无领导小组讨论都可算做情境压力测验。</P>
<P>工作样本测验中,主试通常向被试布置一项工作任务,要求被试在一定时间内完成,观察者对被试完成任务的行为过程和行为结果进行观察和评估。</P>
<P>无领导小组讨论是安排一组互不相识的应聘者(通常为6-8人)组成一个临时任务小组,并不指定任务负责人,请大家就给定任务进行自由讨论,并拿出小组决策意见。</P>
<P>无领导小组讨论可以对三方面的内容进行测量:</P>
<P>个人特点:自信心、挑战性、自我表现的主动性、主动寻求他人同意和赞赏的技巧等;</P>
<P>社交能力:言语表达的流畅性、组织性和逻辑性,对他人的说服力,倾听的技巧等;</P>
<P>领导意识和领导能力:主动扮演领导角色的倾向、对进程的控制能力、意见综合能力等。</P>
<P>模拟情境测验是指通过模拟一个尽可能接近真实工作情境的环境,要求被试完成某项任务,对被试的完成任务的行为过程及行为结果进行观察、评估。模拟情境测验与情境压力测验的唯一区别就是在模拟情境测验中被试处在一个假定的情境中,这个假定情境可以根据测验的需要不断变换,以充分考察被试在不同情境中的表现。</P>
<P>角色扮演测验是通过赋予被试一个假定的角色,要求按照角色的要求表现自己的行为,观察记录并评价角色扮演的行为,评价角色接近程度或胜任力。</P>
<P>⑶自我观察。是由被试自己对自己的行为进行观察,并记录自己行为的方法。有利于被试对自己行为的监控。企业中常采用的“工作日志”就是自我观察的一种应用。</P>
<P>⒌对行为模拟与观察类测量的评价。</P>
<P>行为模拟与观察类测量的最大弊端,是它*作的困难性。这类测量对主试的要求很高,且这类测量通常只能逐个进行,测量的成本很高。这类测验的结果分析也很复杂,分析过程容易有较大的人为化倾向,其客观性受到影响。</P>
<P>行为模拟与观察类测量具有如下优点:</P>
<P>⑴通过行为测量可以观测到被试在具体情境下的真实行为,比对行为的自我评估,其结果更容易令人信服。</P>
<P>⑵通过对情境的*作,可以使测试情境与将来的工作情境尽可能相似,所测量出的结果具有很好的预测效果。</P>
<P>⑶在行为测量中,被试的个人特点和能力可以得到充分的展示。通过对情境的设计,考官可以成功地观测到许多他所想要考察的行为和能力。</P>
<P><BR>如何建立人事测量工具</P>
<P>填空及选择</P>
<P>⒈要建立一项完善的人事测量工具,目标设定是第一步。</P>
<P>⒉根据测量目标确定测量的内容和形式:确定测量内容和形式是决定性的关键,它决定测量有效与否。</P>
<P>⒊根据测量的对象确定题目的形式:在编制测量工具时,还应该考虑使用测量工具的团体的组成和特点,如被试的年龄、智力水平、受教育程度、社会经济地位、文化背景、阅读水平等因素。测量工具针对的对象不同,测量工具采取的形式、题目的编写、测量题目的难度、取样的范围都可能有所不同。</P>
<P>⒋一般在客观题的测验中,为了可供筛选,编写出的题目应比实际需要多20%以上,如考虑到以后还要不断筛选和修改,初次编写的题目可以比实际需要的多出一倍到几倍。</P>
<P>⒌题目的编排:选择和编排过程包括定性的逻辑分析和根据预测的结果进行的定量分析。</P>
<P>⒍对题目进行初步选择的主要依据是:题目本身的性质、对预期测量目标的可测量程度。这一步可细分为如下几个步骤:</P>
<P>⑴检查题目是否符合细目表中某一单元格内容的要求;</P>
<P>⑵根据细目表对各部分所要求的比例选择适当数量的测试,使测量工具尽量覆盖整个细目表的内容;</P>
<P>⑶检查题目是否叙述明确清楚,是否提供了额外线索;</P>
<P>⑷检查题目十分适合将要施测的对象和施测的条件;</P>
<P>⑸检查题目的难度是否恰当,一般来说,难度定为0.50(50%的人答对此题)较为合适(对能力、技能类的题目要求除外);</P>
<P>⑹检查所选择的题目是否彼此独立,没有重叠,即回答某一问题所需的知识与能否回答其他问题无关。</P>
<P>在选择题目时还要注意测量工具的长度。在一个测量工具里究竟包括多少题目比较合适,既要看是否能完全满足测量目的的要求,也要根据测量工具的时间限制和被试的年龄和阅读水平而定。</P>
<P>⒎题目的最佳编排的一般原则:</P>
<P>⑴将测量相同因素的测试题排列在一起;</P>
<P>⑵尽可能地将同一类型的测试题组合在一起;</P>
<P>⑶难度测验的题目应按由易到难排列;</P>
<P>⑷对于人格测验,应尽量避免将测量同一特质的题目编排在一起,防止被试猜测出题目所要测查的因素。</P>
<P>⒏对题目的选取只是依靠编写者的主观经验,题目的效果如何还需要进行定量的客观分析。这时的测试题还只能叫做预备测试题,还需要获取被试对这些题目的反应的材料,为进一步筛选题目和为编排测量工具提供客观依据。</P>
<P>必须将预备测试题对一定规模的小样本被试进行施测,获得数据以进行校验、修订。这一过程称为测试题的预测试。</P>
<P>⒐数据收集上来之后,就应该利用这些数据对题目进行分析,删除不好的题目或对题目进行修改,这个过程称为题目分析,具体内容包括对题目的项目分析和对测验信度、效度指标的检查。</P>
<P>⒑对测试题的预测试应注意以下问题:</P>
<P>⑴预测试对象必须和将来正式测试的对象相似;</P>
<P>⑵预测试的实施过程与情境应力求与将来正式测量工具实施时的情境相似;</P>
<P>⑶预测试的时限可稍宽些,最好使每个被试都能将题目答完,以便搜集充分的反应资料,使统计分析的结果更为可靠;</P>
<P>⑷在预测试过程中,应将被试的各种反映情况随时加以记录。题意不清之处,在修改测验时作为参考。</P>
<P>⒒根据预测结果进行题目分析,对每个题目的具体分析称为项目分析,主要是指根据题目的难度、区分度、备选答案的合适度等数量指标来对题目进行分析。</P>
<P>简答及论述</P>
<P>⒈显示性测量与预测性测量的区别与联系。</P>
<P>显示性测量反映被测者具有什么知识和特点,能完成什么任务。如成就测验、态度测验就是显示性测量。</P>
<P>预测性测量:工具帮助观测一个人在不同情境下的行为。如能力倾向测验可以预测个体将来的工作绩效。角色扮演、公文筐测验能够直接预测个体将来在同样的工作情境中的工作表现。</P>
<P>⒉目标分析与任务分析。</P>
<P>在实际过程中,测量工具的编制者还必须把测量目标转换成可*作的测量指标,这种转换过程称之为*作化或目标分析过程。</P>
<P>目标分析与测量目标是密切相关的。根据测量目的的不同,我们区别以下三个情况来具体分析:</P>
<P>⑴对于有选拔和预测功用的预测性测量工具,主要任务是要对所预测的行为活动做具体分析,故称之为任务分析或工作分析。包括两个步骤:首先要确定,为了使所预测的活动达到成功,需要哪些心理特质和行为。其次,还要建立衡量被试成功与否的标准,称之为效标。效标可以作为鉴别测量工具的预测是否有效的重要指标。</P>
<P>⑵如果测量工具用于测量一种特殊的心理品质或特质,首先必须给所要测量的心理和行为特质下定义,然后找出该特质往往通过什么行为表现出来。</P>
<P>⑶测量工具是描述性的显示测验,它的目标分析的主要任务则是确定所要显示的内容和技能,从中取样。成就测验就是一种典型的描述性显示测验。</P>
<P>双向细目表是一个由测量的内容材料维度和行为技能维度所构成的表格,它能帮助成就测量工具的编制者决定应该选择哪些方面的题目以及各类题目应占的比例。如果要检查新员工培训班的培训效果,那就需要采用成就测验。这种成就测验的内容,就可以利用双向细目表来确定。</P>
<P>⒊测验题目的来源。</P>
<P>收集题目的方法有很多,包括从现成的测验中选取、按照现有理论设计、请专家设计等。如编制态度测量量表,则有关态度的类型、定义等理论都有参考和指导作用。专家无疑是设计测验的重要资源。在收集题目时应注意几个问题:</P>
<P>⑴题目的来源要尽可能地丰富,这样测量内容不至于偏颇,并能提高行为样本的代表性;</P>
<P>⑵题目要有普遍性,尤其是成就测验,要保证所有施测对象都学过该测验中题目所包含的内容;</P>
<P>⑶在编制智力或能力等本身不应体现文化影响的内容的测量题目时,要尽量避免文化背景差异的影响。</P>
<P>⒋题目编写的原则。</P>
<P>对测量工具题目进行编写要遵从某些一般原则,这些原则可以归纳为内容、语言、表达与理解这四个方面。</P>
<P><BR>⑴针对题目内容的原则。</P>
<P>要求题目的内容符合测量工具的目的,避免贪多而乱出题目;</P>
<P>内容取样要有代表性,符合测量工具计划的内容;</P>
<P>各个试题必须彼此独立,不可互相重复或牵连,切忌一个题目的答案影响对另一个题目的回答。</P>
<P>⑵针对题目语言的原则。</P>
<P>使用准确的当代语言,不要使用古僻艰深的词句;</P>
<P>文句简单扼要,既排除与解题无关的陈述,又不要遗漏解题的必要条件;</P>
<P>最好一句话说明一个概念,不要使用两个或两个以上的观念;</P>
<P>意义必须明确,不得暧昧或含糊,尽量少使用双重否定句。</P>
<P>⑶针对题目表达的原则。</P>
<P>尽量避免主观性和情绪化的字句;</P>
<P>不要伤害被试感情,避免涉及社会禁忌或隐私;</P>
<P>避免诱导和暗示答案;</P>
<P>避免令被试为难的问题。</P>
<P>⑷针对题目理解的原则。</P>
<P>题目应有确切答案,不应具有引起争议的可能;</P>
<P>题目内容不要超出受测团体的知识和能力范围;</P>
<P>题目的格式不要引起误解。</P>
<P>⒌题目的分类。</P>
<P>题目的种类很多,根据被试所作出的反应方式进行分类,可分为提供型和选择型题目。</P>
<P>⑴提供型题目:要求被试提供答案,如问答题、填充题。另外,各种*作性题目,如画图、表演、完成某项任务、回答问题等,都可算做提供型题目。</P>
<P>⑵选择型题目:要求被试在提供的备选答案中选择正确答案,如是非题、匹配题、选择题。</P>
<P>⒍测验题目可分为几种类型,并举例说明。</P>
<P>⑴问答题:指示语:试以2000字说明下述问题:①比较问答题和客观题的优劣;②解释进行课堂测量工具项目分析的理由。</P>
<P>⑵填充题:指示语:在每个空格内填上合适的字句:①客观测量工具的客观性的关键是:____;②编制一个预测某种工作成功程度的测量工具的第一个步骤是:____。</P>
<P>⑶是非题:指示语:如果该题正确,请在“是”上划“√”;若该题不正确,请在“否”上划“√”。是 否①心理测量工具只是心理测量的方法之一。</P>
<P>⑷匹配题:指示语:请在右栏选择合适的答案的编号,填在左边每题的编号前。</P>
<P>__①团体智力测量工具 a.比奈</P>
<P>__②个体智力测量工具 b.达尔文</P>
<P>__③兴趣问卷 c.高尔顿</P>
<P>__④人格问卷 d.欧提斯</P>
<P>__⑤线性相关 e.皮尔逊</P>
<P>__⑥感知觉测量工具 f.罗夏克</P>
<P>g.斯皮尔曼</P>
<P>h.斯特朗</P>
<P>i.伍德沃斯</P>
<P>⑸选择题:指示语:下面哪个答案最合适?</P>
<P>__①“决不”、“有时”、“总是”等定语,常常会对毫无所知的被试产生暗示作用。我们称这些词语为</P>
<P>a.普通修饰词 b.连词 c.反应定势 d.特殊决定词</P>
<P>⒎常用题目类型与编制要领。</P>
<P>⑴问答题。</P>
<P>优势:①较好编制,题目无需太多;</P>
<P>②不需准备备选答案,答案是由被试自己生成的;</P>
<P>③可以避免被试随机猜测答案的可能。</P>
<P>存在的问题:①问答题一般回答时间长,占分类大,因此题量不宜太大,所以能测量到的内容也有限,对行为的取样受到局限;</P>
<P>②问答题的评分标准也不容易标准化;</P>
<P>③问答题的评分容易受书写的整洁程度、个人成见等无关因素的影响。</P>
<P>在编制时应注意以下几点:</P>
<P>问题应清楚而且明确,使被试了解答题要求;</P>
<P>题目的数量不要太多,以免变成速度测验;</P>
<P>③在编制题目时应该有一个理想答案或一系列答题标准,同时对另外一些可接受的答案应有所规定和说明。</P>
<P>⑵选择题。</P>
<P>优点:①适用范围广,从一般知识到复杂能力的测量均可使用;</P>
<P>②题意明确,被试的反应简单,容易计分;</P>
<P>③与其他形式的客观题相比,更少受猜测和反应定势的影响,评分较为客观;</P>
<P>④选择题的题量可以较大,考察的范围更广,取样代表性较高。</P>
<P>选择题的不足之处:①诱答难以编制,诱答的数量要求多,而且还要似是而非,让那些不知道正确答案的被试感到无从选择;②通过选择题较难测出个体组织能力、表达能力和创造性等特点。</P>
<P>编制选择题的一般原则:</P>
<P>题干所提出的问题必须明确,使用简单而且清晰的用词。做到即使被试不看选项的情况下,题干本身的意义也是完整的。</P>
<P>不要将选项夹在题干中间,或者在题干前出现与问题无关的材料;</P>
<P>选项要简练,尽量将选项**同的词句移至题干中。这样不仅可以使题意清楚,而且可以减少被试的阅读时间。</P>
<P>⑶是非题。</P>
<P>缺点:①容易受被试反应定势和猜测的影响;</P>
<P>②是非题仅有两种答案,即使猜测,也有50%答对的可能性。弥补这一缺陷的方法之一,是加大题目数,使每一题目分数的偶然性对总分的影响相对减小。</P>
<P>反应定势是指部分被试在回答问题时,其答案的选择建立在题目的形式或位置上(如偏向正面回答或否定回答),而不是建立在题目内容的基础之上。</P>
<P>是非题也有其长处。它能很快书写和阅读,因此题量可以较大,便于广泛取样;记分也比较客观。在能力测验中,是非题多用于只需快速粗略判断被试能力的情况。在人格测验中,多用于只需判断一般普遍行为的问卷中。</P>
<P>编写是非题时要注意以下几点:</P>
<P>测查的内容应以有意义的事实、概念或原理为主,不要考察被试对无关紧要的问题或琐碎的细节的辨别能力。</P>
<P>每道题只能包括一个重要的概念,避免两个以上的概念出现在同一题目中,造成“半对半错”或“似是而非”的情况。且还要把各个概念放在题干的重要位置上。</P>
<P>决定一个题目是否正确,应以重要的概念为基础,不要着重于对次要的或琐碎的观念的判断。</P>
<P>除特殊情况,尽量避免否定的叙述,尤其要避免双重否定的叙述。</P>
<P>测验中正确的题目与错误的题目,它们的长度、复杂性应尽量一致。</P>
<P>正确的题目数与错误的题目数应该基本相等,两种题目应按随机方式排列。</P>
<P>⑷匹配题。一般包括多个反应项(匹配项)和多个刺激项(被匹配项),用反应项来匹配刺激项。匹配题有完全匹配(刺激项与反应项的数量相等)和不完全匹配(反应项目多于刺激项目)两种形式。通常,刺激项目和反应项目分别排成两列。</P>
<P>好处:匹配题容易编制,而且可以在短时间内测量大量相关联的材料,覆盖面较广。但它一般只能测量简单记忆的事实材料或概念关系,并且要求编制的选项必须是同质的。</P>
<P>对编制匹配题的一些建议:</P>
<P>刺激项目和反应项目应该分成两列,通常反应项安排在右边;</P>
<P>配对数目不可过多或过少,最好使用不完全匹配,使反应项数目多于刺激项数目,并且最好不限制每个反应项被选择的次数,这样可以降低猜测的概率;</P>
<P>匹配题的反应项与刺激项,其性质必须相近;</P>
<P>应对匹配方法、匹配的依据加以明确的规定和说明,同时说明反应项可以被选择的次数;</P>
<P>同一组的反应项与刺激项最好印在同一页纸上,以免造成答题时间的浪费;</P>
<P>反应项与刺激项应以不同形式的序号加以标识,以免混淆。</P>
<P>⑸填充题:编制填充题时应注意的几个方面:</P>
<P>最好采用问句形式;</P>
<P>使用直接问句的形式,可避免产生对题意的误解;</P>
<P>如果是填空形式,填充处不可太多。过多空白会使题意不明确;</P>
<P>每题最好只有一个答案,答案最好简短而具体,有利于评分。</P>
<P>⑹*作性测量形式。*作测试题要求被试对未来真实情境中的行为进行模拟,其真实性要高于纸笔测验。*作性测试题通常分为着重过程和着重结果两种形式。</P>
<P>*作性测试有多种不同的分类方法,按测试情境的真实性程度可分:①纸笔的*作性测试:虽用纸笔但偏重于模拟情境下知识的应用,如编制某项*作计划、步骤、注意事项等,如公文筐测验;②模拟*作测试:强调正确的程序,被试需要在模拟情境下完成与真实活动相同的动作,如驾驶员的考核等;③工作样本*作测试:其真实性最高,但是是在有控制的条件下去完成的。如司机在标准场地内的考核。</P>
<P>设计*作性测试题的主要原则有:</P>
<P>明确所要测量的目标,并将其*作化。即要进行工作分析,辩认出*作中最重要的因素,找出具有代表性的工作样本。</P>
<P>要建立作业标准,规定通过此项作业的最低标准。这些都应该*作化。</P>
<P>选择合适的真实性程度。通常情况下,真实性程度越高,模拟的代价越大。</P>
<P>指示语简单明确,让被试知道要干什么和在什么条件下去做。</P>
<P>有明确的计分方法。</P>
<P>作品量表一般包括一系列按顺序排列的不同作业程度、水平、质量的标准样本,评分时参照这些标准样本对被试结果进行评分。</P>
<P>⑺面试。缺点:①面试的考核缺乏心理测量学的严格性,易受考官的个人偏见或歧视的影响;②由于面试既要看应试者对问题回答的内容、质量,还要看整个面试过程中的行为表现,如情绪紧张度、应变能力等,更加大了面试记分的难度。面试效果的好坏往往取决于面试考官。</P>
<P>面试应注意:①面试考官必须对面试主题有充分的了解,对于所要求的反应有清晰的认识;②用于描述或评定被试反应的词语,必须具体化,避免模糊不清的陈述。</P>
<P>⒏编制测验的步骤。</P>
<P>⑴确定测验目的;⑵确定测验性质;⑶确定测验内容;⑷制订测验计划;⑸筛选题目;⑹测验的标准化;⑺对测验的技术分析和鉴定;⑻编写测验指导书。</P>
<P>人事测量的实施与计分</P>
<P>填空及选择</P>
<P>⒈编题时要注意的要点:在能力和成就测验中所使用的时限,以大约90%的被试能在规定时间内完成测验为标准。</P>
<P>⒉标准化测量要求对测验结果进行客观计分。检验客观与否,可以以两个或两个以上受过训练的合格评分者所评结果之间的一致性作为指标。一般情况下,受过训练的评分者之间的平均一致性达到90%以上,我们就认为计分是客观的。</P>
<P>名词解释</P>
<P>指示语是在测量实施时说明测量进行方式以及如何回答问题的指导性语言。指示语通常有两种:一种是对被试的,另一种是给主试的。</P>
<P>简答及论述</P>
<P>⒈主试的职责。</P>
<P>主试,也称考官或主考人,是控制测试进程的主要人员。主试的经验如何往往会对测验的结果产生影响。对于个体测验、投射类测验、*作性测试和面试,主试的作用就更为重要。主试应做以下工作:</P>
<P>⑴测验前的准备工作。</P>
<P>预告测验。事先通知被试;</P>
<P>熟悉测验指示语。</P>
<P>准备测验材料。</P>
<P>熟悉测验的具体程序。</P>
<P>确保满意合适的测验环境。调整光线、通风、噪音水平等物理条件。另外,为防止作弊,还要妥善安排座位等。</P>
<P>⑵测验中主试的职责。</P>
<P>在测验中,主试的主要职责是按照指示语的要求实施测验,在被试询问指示语意义时,作进一步澄清,但注意不要作任何暗示。主试还要注意不要讲与测验无关的话。</P>
<P>⑶建立协调关系。</P>
<P>协调关系指的是主试和被试之间一种友好的、合作的、能促使被试最大限度地做好测验的一种关系。</P>
<P>⒉主试对测量结果的影响。</P>
<P>⑴主试的人格特点。</P>
<P>主试的不同特点对测验的实施及测验的评分等各环节都有影响。有些主试可能自己就不大善于建立和处理人际关系,对他来说在测验实施过程中与被试建立协调关系较为困难,因而由他施测的被试的测验结果可能就会受到影响。</P>
<P>⑵主试的期望。</P>
<P>在有些情况下,实验者所获得的资料及实验结果会受其本身期望的影响,这种现象称为罗森塔尔效应,也称实验者期望误差。</P>
<P>主试对测验结果的影响仍是有限的,是可以通过一定方法有效克服的。要力求做到测验实施过程的标准化,将主试的个人因素对测验结果的影响尽可能降到最低。</P>
<P>⒊被试特点对测量结果的影响。</P>
<P>⑴测验的技巧与练习因素。</P>
<P>测验的技巧。必要时,可以增加练习测验,使所有应试者同等程度地熟悉测验形式。</P>
<P>练习效应。练习因素所产生的影响可归纳为以下几点:</P>
<P>教育背景较差和经验较少者,其受练习因素的影响较为显著;</P>
<P>着重速度的测验,练习效果较为明显;</P>
<P>重复实施相同的测验,受练习影响的程度要大于施测复本测验;</P>
<P>练习的影响仅限于第一次及第二次重测,第二次以后的影响微不足道;</P>
<P>平均而言,练习因素影响的幅度约在0.2个标准差以下。</P>
<P>⑵焦虑和动机因素。</P>
<P>应试动机。被试参加测验的动机不同,会影响其回答问题的态度、注意力、持久性以及反应速度等,从而影响最后测量结果。</P>
<P>测验焦虑。焦虑是一种不愉快的、表现为焦急、恐惧和紧张的情绪体验,它主要是由于对可能出现的测验结果的担心或对应付测验结果的能力的担心而造成。大多数人在测验前和测验中感到焦虑,故又称测验焦虑或考试焦虑。</P>
<P>⑶反应定势。</P>
<P>也称反应的方式或反应风格,简单地说,就是每个人回答问题的习惯方式。由于每个人回答问题的习惯不同,可能会使有相同能力的被试获得不同的分数。影响测量结果的反应定势主要有以下几种:</P>
<P>求“快”与求“精确”的反应定势。有些被试反应特别谨慎,体现为求“精确”的反应定势;另外有些人则特别快而且粗心大意,这就是求“快”的反应定势。</P>
<P>反应时间应以90%的被试可以答完所有试题为准。</P>
<P>偏好正面叙述的反应定势。被试在无法确定“是非题”的正确答案时,选“是”的人多于选“非”的人。这种定势又称肯定反应定势。</P>
<P>偏好特殊位置的反应定势。被试如果完全不知道选择题的正确答案,则不会以完全随机的方式来决定该选择哪一个选项,而有偏好某一个位置的选项的倾向,也称位置定势。</P>
<P>偏好较长选项的反应定势。有人发现被试在无法确定正确答案时,有偏好选择较长选项的反应定势。</P>
<P>猜测的反应定势。</P>
<P>⒋猜测的校正。</P>
<P>⑴猜测修正的方法。</P>
<P>S=R-W/(n-1) </P>
<P>其中,S是正确分数,R为被试答对的题目数,W为被试答错的题目数,n选项数目。</P>
<P>⑴针对题目内容的原则。</P>
<P>要求题目的内容符合测量工具的目的,避免贪多而乱出题目;</P>
<P>内容取样要有代表性,符合测量工具计划的内容;</P>
<P>各个试题必须彼此独立,不可互相重复或牵连,切忌一个题目的答案影响对另一个题目的回答。</P>
<P>⑵针对题目语言的原则。</P>
<P>使用准确的当代语言,不要使用古僻艰深的词句;</P>
<P>文句简单扼要,既排除与解题无关的陈述,又不要遗漏解题的必要条件;</P>
<P>最好一句话说明一个概念,不要使用两个或两个以上的观念;</P>
<P>意义必须明确,不得暧昧或含糊,尽量少使用双重否定句。</P>
<P>⑶针对题目表达的原则。</P>
<P>尽量避免主观性和情绪化的字句;</P>
<P>不要伤害被试感情,避免涉及社会禁忌或隐私;</P>
<P>避免诱导和暗示答案;</P>
<P>避免令被试为难的问题。</P>
<P>⑷针对题目理解的原则。</P>
<P>题目应有确切答案,不应具有引起争议的可能;</P>
<P>题目内容不要超出受测团体的知识和能力范围;</P>
<P>题目的格式不要引起误解。</P>
<P>⒌题目的分类。</P>
<P>题目的种类很多,根据被试所作出的反应方式进行分类,可分为提供型和选择型题目。</P>
<P>⑴提供型题目:要求被试提供答案,如问答题、填充题。另外,各种*作性题目,如画图、表演、完成某项任务、回答问题等,都可算做提供型题目。</P>
<P>⑵选择型题目:要求被试在提供的备选答案中选择正确答案,如是非题、匹配题、选择题。</P>
<P>⒍测验题目可分为几种类型,并举例说明。</P>
<P>⑴问答题:指示语:试以2000字说明下述问题:①比较问答题和客观题的优劣;②解释进行课堂测量工具项目分析的理由。</P>
<P>⑵填充题:指示语:在每个空格内填上合适的字句:①客观测量工具的客观性的关键是:____;②编制一个预测某种工作成功程度的测量工具的第一个步骤是:____。</P>
<P>⑶是非题:指示语:如果该题正确,请在“是”上划“√”;若该题不正确,请在“否”上划“√”。是 否①心理测量工具只是心理测量的方法之一。</P>
<P>⑷匹配题:指示语:请在右栏选择合适的答案的编号,填在左边每题的编号前。</P>
<P>__①团体智力测量工具 a.比奈</P>
<P>__②个体智力测量工具 b.达尔文</P>
<P>__③兴趣问卷 c.高尔顿</P>
<P>__④人格问卷 d.欧提斯</P>
<P>__⑤线性相关 e.皮尔逊</P>
<P>__⑥感知觉测量工具 f.罗夏克</P>
<P>g.斯皮尔曼</P>
<P>h.斯特朗</P>
<P>i.伍德沃斯</P>
<P>⑸选择题:指示语:下面哪个答案最合适?</P>
<P>__①“决不”、“有时”、“总是”等定语,常常会对毫无所知的被试产生暗示作用。我们称这些词语为</P>
<P>a.普通修饰词 b.连词 c.反应定势 d.特殊决定词</P>
<P>⒎常用题目类型与编制要领。</P>
<P>⑴问答题。</P>
<P>优势:①较好编制,题目无需太多;</P>
<P>②不需准备备选答案,答案是由被试自己生成的;</P>
<P>③可以避免被试随机猜测答案的可能。</P>
<P>存在的问题:①问答题一般回答时间长,占分类大,因此题量不宜太大,所以能测量到的内容也有限,对行为的取样受到局限;</P>
<P>②问答题的评分标准也不容易标准化;</P>
<P>③问答题的评分容易受书写的整洁程度、个人成见等无关因素的影响。</P>
<P>在编制时应注意以下几点:</P>
<P>问题应清楚而且明确,使被试了解答题要求;</P>
<P>题目的数量不要太多,以免变成速度测验;</P>
<P>③在编制题目时应该有一个理想答案或一系列答题标准,同时对另外一些可接受的答案应有所规定和说明。</P>
<P>⑵选择题。</P>
<P>优点:①适用范围广,从一般知识到复杂能力的测量均可使用;</P>
<P>②题意明确,被试的反应简单,容易计分;</P>
<P>③与其他形式的客观题相比,更少受猜测和反应定势的影响,评分较为客观;</P>
<P>④选择题的题量可以较大,考察的范围更广,取样代表性较高。</P>
<P>选择题的不足之处:①诱答难以编制,诱答的数量要求多,而且还要似是而非,让那些不知道正确答案的被试感到无从选择;②通过选择题较难测出个体组织能力、表达能力和创造性等特点。</P>
<P>编制选择题的一般原则:</P>
<P>题干所提出的问题必须明确,使用简单而且清晰的用词。做到即使被试不看选项的情况下,题干本身的意义也是完整的。</P>
<P>不要将选项夹在题干中间,或者在题干前出现与问题无关的材料;</P>
<P>选项要简练,尽量将选项**同的词句移至题干中。这样不仅可以使题意清楚,而且可以减少被试的阅读时间。</P>
<P>⑶是非题。</P>
<P>缺点:①容易受被试反应定势和猜测的影响;</P>
<P>②是非题仅有两种答案,即使猜测,也有50%答对的可能性。弥补这一缺陷的方法之一,是加大题目数,使每一题目分数的偶然性对总分的影响相对减小。</P>
<P>反应定势是指部分被试在回答问题时,其答案的选择建立在题目的形式或位置上(如偏向正面回答或否定回答),而不是建立在题目内容的基础之上。</P>
<P>是非题也有其长处。它能很快书写和阅读,因此题量可以较大,便于广泛取样;记分也比较客观。在能力测验中,是非题多用于只需快速粗略判断被试能力的情况。在人格测验中,多用于只需判断一般普遍行为的问卷中。</P>
<P>编写是非题时要注意以下几点:</P>
<P>测查的内容应以有意义的事实、概念或原理为主,不要考察被试对无关紧要的问题或琐碎的细节的辨别能力。</P>
<P>每道题只能包括一个重要的概念,避免两个以上的概念出现在同一题目中,造成“半对半错”或“似是而非”的情况。且还要把各个概念放在题干的重要位置上。</P>
<P>决定一个题目是否正确,应以重要的概念为基础,不要着重于对次要的或琐碎的观念的判断。</P>
<P>除特殊情况,尽量避免否定的叙述,尤其要避免双重否定的叙述。</P>
<P>测验中正确的题目与错误的题目,它们的长度、复杂性应尽量一致。</P>
<P>正确的题目数与错误的题目数应该基本相等,两种题目应按随机方式排列。</P>
<P>⑷匹配题。一般包括多个反应项(匹配项)和多个刺激项(被匹配项),用反应项来匹配刺激项。匹配题有完全匹配(刺激项与反应项的数量相等)和不完全匹配(反应项目多于刺激项目)两种形式。通常,刺激项目和反应项目分别排成两列。</P>
<P>好处:匹配题容易编制,而且可以在短时间内测量大量相关联的材料,覆盖面较广。但它一般只能测量简单记忆的事实材料或概念关系,并且要求编制的选项必须是同质的。</P>
<P>对编制匹配题的一些建议:</P>
<P>刺激项目和反应项目应该分成两列,通常反应项安排在右边;</P>
<P>配对数目不可过多或过少,最好使用不完全匹配,使反应项数目多于刺激项数目,并且最好不限制每个反应项被选择的次数,这样可以降低猜测的概率;</P>
<P>匹配题的反应项与刺激项,其性质必须相近;</P>
<P>应对匹配方法、匹配的依据加以明确的规定和说明,同时说明反应项可以被选择的次数;</P>
<P>同一组的反应项与刺激项最好印在同一页纸上,以免造成答题时间的浪费;</P>
<P>反应项与刺激项应以不同形式的序号加以标识,以免混淆。</P>
<P>⑸填充题:编制填充题时应注意的几个方面:</P>
<P>最好采用问句形式;</P>
<P>使用直接问句的形式,可避免产生对题意的误解;</P>
<P>如果是填空形式,填充处不可太多。过多空白会使题意不明确;</P>
<P>每题最好只有一个答案,答案最好简短而具体,有利于评分。</P>
<P>⑹*作性测量形式。*作测试题要求被试对未来真实情境中的行为进行模拟,其真实性要高于纸笔测验。*作性测试题通常分为着重过程和着重结果两种形式。</P>
<P>*作性测试有多种不同的分类方法,按测试情境的真实性程度可分:①纸笔的*作性测试:虽用纸笔但偏重于模拟情境下知识的应用,如编制某项*作计划、步骤、注意事项等,如公文筐测验;②模拟*作测试:强调正确的程序,被试需要在模拟情境下完成与真实活动相同的动作,如驾驶员的考核等;③工作样本*作测试:其真实性最高,但是是在有控制的条件下去完成的。如司机在标准场地内的考核。</P>
<P>设计*作性测试题的主要原则有:</P>
<P>明确所要测量的目标,并将其*作化。即要进行工作分析,辩认出*作中最重要的因素,找出具有代表性的工作样本。</P>
<P>要建立作业标准,规定通过此项作业的最低标准。这些都应该*作化。</P>
<P>选择合适的真实性程度。通常情况下,真实性程度越高,模拟的代价越大。</P>
<P>指示语简单明确,让被试知道要干什么和在什么条件下去做。</P>
<P>有明确的计分方法。</P>
<P>作品量表一般包括一系列按顺序排列的不同作业程度、水平、质量的标准样本,评分时参照这些标准样本对被试结果进行评分。</P>
<P>⑺面试。缺点:①面试的考核缺乏心理测量学的严格性,易受考官的个人偏见或歧视的影响;②由于面试既要看应试者对问题回答的内容、质量,还要看整个面试过程中的行为表现,如情绪紧张度、应变能力等,更加大了面试记分的难度。面试效果的好坏往往取决于面试考官。</P>
<P>面试应注意:①面试考官必须对面试主题有充分的了解,对于所要求的反应有清晰的认识;②用于描述或评定被试反应的词语,必须具体化,避免模糊不清的陈述。</P>
<P>⒏编制测验的步骤。</P>
<P>⑴确定测验目的;⑵确定测验性质;⑶确定测验内容;⑷制订测验计划;⑸筛选题目;⑹测验的标准化;⑺对测验的技术分析和鉴定;⑻编写测验指导书。</P>
<P>人事测量的实施与计分</P>
<P>填空及选择</P>
<P>⒈编题时要注意的要点:在能力和成就测验中所使用的时限,以大约90%的被试能在规定时间内完成测验为标准。</P>
<P>⒉标准化测量要求对测验结果进行客观计分。检验客观与否,可以以两个或两个以上受过训练的合格评分者所评结果之间的一致性作为指标。一般情况下,受过训练的评分者之间的平均一致性达到90%以上,我们就认为计分是客观的。</P>
<P>名词解释</P>
<P>指示语是在测量实施时说明测量进行方式以及如何回答问题的指导性语言。指示语通常有两种:一种是对被试的,另一种是给主试的。</P>
<P>简答及论述</P>
<P>⒈主试的职责。</P>
<P>主试,也称考官或主考人,是控制测试进程的主要人员。主试的经验如何往往会对测验的结果产生影响。对于个体测验、投射类测验、*作性测试和面试,主试的作用就更为重要。主试应做以下工作:</P>
<P>⑴测验前的准备工作。</P>
<P>预告测验。事先通知被试;</P>
<P>熟悉测验指示语。</P>
<P>准备测验材料。</P>
<P>熟悉测验的具体程序。</P>
<P>计算:一份试卷由100个客观题组成,每题1分,每个客观题都有5个备选项,甲应试者完成了整份试卷,答对了70题,请问猜测修正后,甲得62.5分。另有乙完成了90题,也答对了70题,乙得65分。S甲=70-30/(5-1)=62.5;S乙=70-20/(5-1)=65。</P>
<P>⑵猜测修正的优缺点。</P>
<P>赞成使用猜测修正公式的人认为:</P>
<P>修正公式可避免减低测验的信度。</P>
<P>修正公式可以反映被试真正的能力水平。</P>
<P>使用修正公式对那些不能答完全部试题的被试来说比较公平。</P>
<P>反对使用猜测修正公式的人则认为:</P>
<P>公式假设不成立,答错试题,是因为观念模糊、记忆不清或粗心大意,并非乱猜。</P>
<P>只要所有被试能答完全部题目,或者是略去未答的题目数相同,则猜测修正无实质作用。</P>
<P>未采用猜测修正对信度并无重大影响。</P>
<P>实际生活中,常常需要仅凭部分知识来作判断,因此完全不许猜测也与实际生活不符。</P>
<P>⑶在编制测题时要注意:</P>
<P>选项数目要多,4-5项较合适;</P>
<P>题目数量加多;</P>
<P>时间要充裕;</P>
<P>经常以项目分析评鉴试题,并淘汰不好的试题。</P>
<P>⒌计分的一般程序。</P>
<P>⑴计分的基本步骤主要有三步:</P>
<P>①记录反应。②检索标准答案。③反应和标准答案的比较。</P>
<P>⑵问答题计分。</P>
<P>问答题的主要缺点是评分不够客观,也就是说问答题的计分经常受到评分者的情感、态度的影响。问答题中常见的误差有:宽容定势和晕轮效应。宽容定势指主试的计分过于宽松,即使没有回答出题目所要求的答案,评分者也给予较高的分数;晕轮效应指给予被试某道题较高分数仅仅是由于被试在另外一些试题上获得了高分,也就是说对被试的一般印象影响到具体某个问题的评价。</P>
<P>为了使问答题的计分更加客观和可信,主试应该首先考虑采用何种计分程序:整体计分还是分析计分。整体计分就是评分者根据总体印象给答案评一个总分。整体计分在实际中应用较为普遍。分析计分是给问答题的不同部分分派不同的权数,按照各部分的要求对答案中所包括的信息和技能评分,最后将各部分的权数和得分组合起来得到该问答题的分数。分析计分往往有答题的详细标准。</P>
<P>⑶客观题计分。</P>
<P>客观题的一个主要优点就是计分简单、客观。</P>
<P>信心权数:多大程度上在给出的答案是正确的。伊贝尔是非题加权方法是信心权数应用。</P> |
|