北京大学人事测量串讲笔记

林の声音 · 发表于 2005-11-30 02:52:14

北京大学人事测量串讲笔记（2003年） 
人事测量概论
常模是否可靠，关键是有没有一个具有代表性的被试样本。
名词解释
⒈心理测验是心理测量的一种具体方法和手段，它是结合心理学和统计学方法评价特定个体在特定素质上相对于特定群体所处的水平的手段。心理测验是人事测量中最常采用的方法之一。
⒉常模是一组具有代表性的被试样本的测验成绩的分布结构，包括它的集中趋势和离散度。常模是用以比较不同被测者测验分数的标准，它能够说明某一测验结果分数相对于同类被测者所处的水平。
⒊天花板效应：测验题目过于容易，致使大部分个体得分普遍较高的现象。
⒋地板效应：测验题目过难，大部分个体得分普遍较差的现象。
⒌测量的形式和工具根据测量内容的不同而不同。如，需要对应聘营销人员的口头表达、情绪控制等方面进行测查，就不宜采用一般的纸笔测验，而最好采用情境模拟测验，如小组讨论测验。但考虑一般自陈量表（即基于自我评价的问卷）的动机测验题目表面效度（即从题目表面是否容易看出出题人的意向和答案倾向）过高，或应聘者容易表现出较高的社会赞许性，即题目本身的答案反映了一般社会价值倾向，应答者很容易表现出反应偏差，投其所好，故可能不适合于在招聘考核中采用时，就可采用隐蔽性比较高的投射测验来对应试者的动机进行评定。
投射测验是人格测量的工具，考察人格个性特征，通过迂回曲折的方式投射出的个性动机、兴趣等方面。
简答及论述
⒈简述心理测量和人事测量的关系。
⑴心理测量是通过科学、客观、标准的测量手段对人的特定素质进行测量、分析、评价。所谓素质，是指那些完成特定工作或活动所需要或与之相关的感知、技能、能力、气质、性格、兴趣、动机等个人特征，它是以一定的质量和速度完成工作或活动的必要基础。
⑵人事测量是心理测量技术在人事管理领域的应用，它以心理测量为基础，针对特定的人事管理目的如招聘、安置、考核、晋升、培训等，对人的素质进行多方面系统评价，从而为人事管理、开发提供参考依据。相对来说，人事测量是一个更广泛的实用概念，它通常要求运用多种心理测量工具来完成。
⑶心理测量是人事测量的基础。人事测量是以人为对象，是对人的测量，这正是以心理测量为基础进行的。绝大多数人决策都需要以人事测量为基础。如招聘人员时，要测量应聘者的能力、工作动机；考虑晋升时要评价能力是否胜任新的职位；计划培训时要考察对象在哪些方面对于完成规定的工作任务有不足。所有这一切都要运用心理测量。故要从事人事测量，首先要掌握心理测量。
⒉心理测验的五个基本要素。
⑴行为样本。（①行为样本数量必须足够多，以使从样本到总体的推测错误率尽可能最低；②要保证所选择样本的具有对总体样本的代表性）
对个体行为或行为特征的测查无法做到对所有情况面面俱到。在进行心理测量时，往往只能对经过科学选择的少数行为样本进行测查，借以推测个体的心理特征。如要考察个体的数学运算能力，可以选择一定数量有代表性的运算题进行测量。个体对所抽选出来的问题的解决行为就是行为样本。
⑵标准化。
是指测验编制、实施、记分和测验分数解释必须遵循严格的统一的科学程序，保证对所有被测者来说施测的内容、条件、记分过程、解释系统都相同。只有这样才能保证测验的客观性和准确性。
⑶难度的客观测量。
测验题目的难度水平影响到测验的客观性。测验的题目太容易，所有人都成功地完成所有项目，得分都很高，或测验题目太难，使得大部分人的得分很低，都会使所有被测者的反应趋于一致，抹消了个体差异，无法就某一素质将不同的被测者很好地区别开来，致使测验的目的无法达到。
⑷信度。
信度是指测验结果的可靠性、稳定性，即测验结果是否反映了被测者的稳定的、一贯性的真实特征。这种可靠性体现在：
测验结果跨时间的一致性――被测者在不同时间所测结果一致；
测验内容的一致性――同一测验内的各部分题目所测的是同一种行为或行为特征；
不同评分者之间的一致性――不同评分者对同一测验结果的评分一致。
⑸效度。
效度是指所测量到的结果是否反映了所想要考察的内容，也就是说，该测验所测的是不是它想要测的东西。
效度指标主要包括效标关联效度、内容效度和构想效度等。
⒊人事测量的功能与用途。
人事测量的具体功能涉及甄选、安置、考核与培训等几个方面。
⑴甄选。
在人事管理领域，人事测量可以用来对人才进行选拔。人事甄选的一个关键技术问题，是如何预测未来工作的绩效。人事测量恰恰可以为预测应聘者将来的工作行为和绩效提供重要的科学依据。
⑵安置。
通过人事测量，可以对个体的兴趣、人格、能力、技能等多方面进行分析，为实现人才的合理安置提供信息。
⑶考核与培训。
人事测量能够提供关于个体的行为的描述，形成对被测者的全面的评价，从而为人事考核及培训提供依据。
⒋简述人事测量的程序。
确定测量目的
（根据岗位职务任职要求确定检测内容）
↓
确定测量方法
（确定测量的基本形式和测量工具）
↓
实施测量
（测量的实施与数据采集）
↓
分析测量结果
（对采集数据进行统计分析并作出报告）
↓
人事决策与建议
（根据分析作出决策或对决策的建议）
⑴确定测量的目的和内容。
根据不同的测量目的确定具体的测量内容是人事测量的第一步。测量内容应根据所选拔岗位的任职素质要求，通常可以工作分析、职务说明为依据。
⑵确定测量的基本形式和测量工具。
测量的形式和工具根据测量内容的不同而不同。测量形式和工具的确定也是非常重要的一步。不恰当的测量方法会使测量结果不能满足测量目的，甚至会导致收集到虚假信息，误导决策的制定。
⑶测量的实施与数据采集。
在测量的实施过程中，要注意做到客观化、标准化，保证收集到的测量结果能够公平、真实地反映应试者的状况。在收集测量资料的同时，要注意将实施测量的过程中相关的信息及可能决策产生影响的细节记录下来，作为决策的辅助材料。另外，对测量结果造成影响的特殊因素也应进行记录。
通常，要求测量的现场环境要空气通畅、新鲜，照明充足，温度、湿度适宜，干净整洁，安静，没有外界干扰，每个被测者的桌椅应尽可能舒适，并有足够的空间，尤其避免多个被试者同时应试时相互影响、干扰。
⑷分析测量结果。
对测量结果的分析通常包括对测量结果的计分、统计和解释。使用者只需按照测验说明进行*作即可。
⑸根据分析作出决策或对决策的建议。
决策与测量的目的联系紧密，以选拔为目的的测量，其决策内容为候选人名单；以安置为目的的测量，其决策内容为岗位与应聘者的匹配；以评价为目的的测量，其决策内容为对应试者素质的评价；以诊断为目的的测量，其决策内容为应试者的问题和特长或应试团体的状况和管理问题；以预测为目的的测量，其决策内容为应试者将来的绩效和工作表现。
⑹跟踪检验和反馈。
在多数情况下，需要对测量结果及聘用结果进行跟踪，主要是根据工作绩效对测量结果和聘用进行检验，这就为此前的工作提供了重要的反馈，为测量取得经验性资料，为进一步矫正测量以达到更大的精确度提供了依据。可以说，到这一阶段，才真正完成了一个人事测量作业环路。
人事测量的历史
填空及选择
⒈世界上第一个具有应用价值的心理测验，是FaGuo心理学家比奈制定的智力测验。
比奈的智力测验作为最早的评价、鉴定智力的结构和水平的测量工具，是应社会的需要而产生的。
⒉世界上第一个标准化的人格问卷――武德沃斯编制的“个人资料调查表”，鉴别不能从事军队工作的神经症患者。第一个职业兴趣测验――斯特朗男性职业兴趣量表，广泛应用于职业选择、人才选拔。
⒊历史上最著名的职业兴趣测验有斯特朗－坎培尔职业兴趣测验和霍兰德职业兴趣问卷。它们都通过分析确定职业兴趣而分为六大类：社交型、艺术型、研究型、技能型、事务型、经营型。
⒋燕京大学校长陆志韦先生发表了经修订的比奈－西蒙量表，这就是中国最早的标准化的比奈智力测验。
1979年，北京大学心理学系的吴天敏教授对中国的比奈量表进行第三次修订。
二、名词解释
⒈智力包括一切高级的心理过程，并突出表现在推理、判断、问题解决的能力上。
⒉“1905年比奈――西蒙量表”。量表是说心理测验是一种以人的心理为内容的、有一定量度的量具。就是指测量心理的度量工具。
⒊1905年比奈――西蒙量表是一项个体测验，这是相对于团体测验而言的，因为测验是以单一个体为实施对象而设计的。
团体测验能使我们迅速而有效地同时收集到大量测验者的资料。美国心理学家编制了第一个团体智力测验――陆军甲种测验和适用于母语非英语的被试和文盲被试的陆军乙种测验。
团体测验采用多项选择，而个体测验多采用开放式问题、团体测验多采用客观的计算机计分，而个体测验一般为施测者计分、团体测验为团体施测，个体测验为个体施测、团体测验多用于筛选，而个体测验多用于诊断及弥补工作、团体测验标准化样本极大，一般在几十万左右，而个体测验一般只用几千名精心挑选的被试。
⒋智力年龄即为每一个年龄确定出难度最适宜的题目，用被测者所能完成的最大难度的题目所对应的年龄作为该被测者的智力年龄。
实足年龄：自己本身的生理年龄。
⒌时间均匀性：其智力落后的程度不是保持固定的时间程度不变，而是按照一个比例，越来越大。
⒍智商IQ=100X智力年龄／实足年龄。
计算：一个儿童参加了比奈智力测验，他完成了前14题，即智力年龄为5岁，若他的实际年龄4岁6个月，则比率智商IQ=5/4.5*100%=111%。
⒎离差智商：以标准差为单位计算测验分数偏离平均数的方向和程度。
⒏纸笔智力测验：欧提斯编制的，十分适合于团体施测，其中的多项选择题和其他客观题都是首次采用。这项测验最后编制修订成著名的军队α和军队β测验，即陆军甲种测验和陆军乙种测验，前者为文字测验，后者为非文字测验，专门为文盲和不懂英文的新兵设计的。
⒐人事管理思想：⑴工作的绩效和人的素质有关，要追求高的工作绩效，必须有高素质的人才；⑵不同的工作对人的素质结构的要求不同，必须有针对性地为不同的工作匹配不同的人才，才能确保各种工作的高绩效，做到恰当的人做恰当的事。这也就是最经典的“人――事匹配”的思想。
⒑分化能力性向测验：从语言理解、语言推理、数学推理、抽象推理、空间推理、机械推理等六个方面检测人的智力水平，从而整体分析智力结构。
⒒动机是指由特定需要引起的，欲满足该种需要的特殊心理状态和意愿。
⒓一般生活动机是指人们广泛的生活领域中具有普遍性的需求所导致的动机。主要理论有马斯洛的需要层次理论，赫兹伯格的保健－激励理论，奥德佛尔的ERG理论（ERG即生存、关系、成长）。
⒔工作动机是具体指驱使人们工作的原因。麦克里兰提出了三重需要理论：成就动机，即寻求获得成功；权力动机，即寻求获得、保持和运用对他人的影响和支配；亲和动机，即寻求与多数人群保持密切的关系。又提出能力动机，即寻求不断获得、运用和增长才能。
三、简答及论述
⒈简述人格如何影响人？与工作的关系是什么？
人格主要指人所具有的与他人相区别的独特而稳定的思维方式和行为风格。人格同人的工作绩效和工作方式及习惯有关。涉及以下几个方面：
⑴人格会影响人在工作中对事物的理解。
有的人看待事物比较独立，有自己的主见；有的人则很容易受周围人和环境的影响和暗示，判断事物缺乏自己的标准，即场依存性。
⑵人格会影响人处理事物的方法。
有的人处世谨慎，凡事谨小慎微，有的人则不拘小节，放荡不羁，敢于冒险。有的人做事优柔寡断，有的人做事坚决果断等。
⑶人格会影响人在工作中与他人相互沟通的方式。
有的人善解人意，能体察对方心情，有的人则麻木不仁，反应迟钝。有的人善于为对方设身处地地着想，能换位思考，从对方角度看问题，有的人说话善于调侃，调整气氛，有的人说话则过于直率，甚至失于尖刻，易于伤人。
⑷人格会影响人独特的表现方式。
有的人情绪稳定，心气平和，有的人多愁善感，有的人脾气乖戾，喜怒无常。有的人做事我行我素，独往独来，有的人则善于察言观色，或随群附众。有的人做事很讲义气，重情分，有的人则薄情寡义。
由上述可知，不同的人的确会给工作带来不同的结果。这也就要求人事诊断和安置作出相应的考虑并采取相应的方法。
⒉人事测量技术的发展。
⑴出现大量适用于人事管理领域的测验。
Wonderlic人事测验、一般能力性向测验、分化能力性向测验、DISC人格测验等。
⑵面试技术在人才选拔中广泛应用。
面试历来是招聘过程中必不可少的一个过程，企业开始寻求一种客观、公正的面试评估方法，于是，结构化、半结构化的面试在企业大受欢迎，标准化的面试提问表和评分表在招聘中被普遍采用。
⑶人格测验成为人才甄选程序的必要过程。
现代企业开始认识到许多非智力因素，如性格、情绪特质、人际关系技巧、动机、兴趣和态度模式等方面，对工作方式甚至工作绩效都有十分重要的影响。各种对人格进行测量的工具受到企业的欢迎，人格测验成为人才甄选程序的必要过程之一。
⑷针对具体要求的测验设计、组合越来越重要。
由于现代企业对人才素质的要求越来越精细化、多面化，并越来越强调企业自身的特点对人才选拔的要求，人事测量正向迎合具体企业要求和岗位要求的方向发展。于是，在人事测量领域越来越强调针对具体要求设计测验和对测验进行合理组合。

人事测量在企业的人才选拔、培训、考核等领域发挥着重要的作用。随着企业管理科学化的发展，人事测量已成为现代企业人力资源管理的必要工具之一。
人事测量的基本类型
填空及选择
⒈标准化的纸笔类测验的优点：方便性、经济性、客观性。
标准化纸笔测验的不足之处：
⑴受测验的形式所制约，它无法对被测者实际的行为表现进行测量；
⑵纸笔测验的实施较为程式化，我们只能收集到测验中所考察的信息，而对于测验外的信息我们一无所知。
⑶纸笔形式测验中有标准答案的测验如能力测验，并不能完全避免考试技巧和猜测因素的影响。
⒉投射技术一词由富兰克于1939年首先明确提出。
名词解释
⒈纸笔测验就是只用纸和笔就能进行的测验。这类测验在实施过程中，一般不需要借助其他工具和手段。标准化的纸笔测验一般有事前确定好的测验题目和答卷以及详细的答题说明，测验题目往往以客观题居多，但也有不少是主观自陈评价题。有的测验限定时间，有的则不限定时间。一个标准的纸笔测验系统还包括客观的计分系统、解释系统、良好的常模以及值得信服的信度、效度和项目分析数据。
⒉投射测验要求被试对一些模棱两可或模糊不清、结构不明确的刺激作出描述或反应，通过对这些反应的分析来推断被试的内在心理特点。其逻辑假定是，人们对外在事物的看法实际上反映出其内在的真实状态或特征。
⒊公文筐测验是让被试在所安排的假想的情境中扮演某种管理者的角色，对事先设计的一系列文件进行处理，进而针对被试处理公文的方式、方法、结果等进行评价。公文筐测验一般用于对高级管理者的评价，它可以对应试者的计划、预测、决策、沟通等管理能力进行测查，在管理领域应用十分广泛。
⒋面试是考官针对自己感兴趣的、与工作有关的各种问题，与应聘者进行面对面的交谈，收集有关信息，从而达到了解、评价应聘者的目的。
面试按其形式的不同可以分为结构化面试和非结构化面试。
⑴结构化面试往往有事先确定的提问提纲，里面列出需要了解的各方面的问题，而且这些问题通常还可能有一定的内在的逻辑结构。
⑵非结构化面试则没有固定的面谈程序，面谈者提问的内容和顺序都取决于面谈者的兴趣和现场应试者的回答。这种面试方法给谈话双方以充分的自由。
⒌调查法。在人事管理工作中，经常使用的一种测量方法。指就员工的某些意愿、态度、观点或感受等认知性或情感性心理状态或行为倾向，进行一定范围的信息搜集，并就相应状态或倾向的特性、程度、广泛性等作出分析评价，通常由一系列问题构成，可以是纸笔形式，也可以是访谈形式。
简答及论述
⒈投射测验的主要特点。
投射测验的主要特点是它的非结构性、掩蔽性和整体性。
⑴非结构性。指投射测验使用非结构化任务作为测验材料，即允许被试产生各种各样不受限制的反应。
⑵掩蔽性。指测验的目的的隐蔽性，被试一般不可能知道测验的真实目的，也不知道对自己的反应将作何种心理学解释，减少了被试的伪装自己的可能性。
⑶整体性。指测验关注的是对人的总体评估，而不是针对单个特质的测量。
⒉投射测验的分类及实例。
林德塞按照测验所引起的反应性质将投射测验分为五类：
⑴联想法投射测验。
测验任务为报告因某种刺激所引起的联想。罗夏克墨迹测验，测试材料：10张墨迹图，其中5张是黑白的，2张有黑色和红色墨迹，另外3张为淡彩色墨迹图。测验任务：看图片后对图画内容进行自由联想，主试通常问“请告诉我你在图片中看到了什么，或者想起了什么？”回答后主试又将图片展示出来，询问是图片的哪个部分，哪些因素致使被试作出以上联想的。
⑵构造法投射测验。
测验任务为让被试编造或创造一些作品。绘人测验，测验任务：要求被试在一张白纸上用铅笔任意画一个人。画完后，再要求被试画一个与前者性别相反的人。最后，主试可以通过面谈的方式向被试了解他所画人物的年龄、职业、爱好、家庭、社交等信息。最后测验者对被试的作品进行分析。
⑶完成法投射测验。
测验任务为让被试对一项不完整的材料进行填补使其完整，如语句完成法。罗特未完成句子量表，测验任务：要求被试将一系列句干补充成完整的句子。通过被试的反应可以对被试的家庭态度、社会与性态度、一般态度、品格态度进行解释。
⑷选择或排列法投射测验。
测验任务为让被试将一些刺激按照某种原则进行选择或予以排列。可以让被试将一些描述人性格的词按照其好恶程度或适宜程度排序，从顺序中可以分析出被试的人格。
⑸表露法投射测验。
测试任务为让被试利用某种媒介自由地表露自己的心理状态。可以通过书写、谈论、歌唱、绘画等形式让被试自由表达，从中分析其人格。
⒊对投射类测验的评价。
通过投射技术可以使被试不愿表现的个性特征、内在冲突和态度更容易地表达出来，因而在对人格结构、内容的深度分析上有独特的功能。但对于投射测验一直存在相当多的批评：
⑴由于投射测验结果的分析一般是凭分析者的经验的主观推断，其科学性有待进一步考察。
⑵投射测验在计分和解释上相对缺乏客观标准，人为性较强，不同的测验者对同一测验结果的解释往往不同，并且，投射测验的重测信度也很低。
⑶投射技术是否能真正避免防御反应的干扰，在研究上并未得出一致结论。
投射测验除具有上述缺点之外，在应用时还有如下不便之处：
⑴投射测验一般为个体测验，不仅测验时间长，分析结果所需要的时间也很长，实施起来耗费精力。
⑵投射测验对主试和评分者的要求很高，一般只能由经验丰富、有专业背景的人担当。
⑶对投射测验结果的评价带有浓重的主观色彩，不能满足人事测验的公平性原则。
⒋行为观察法。
行为模拟与观察类测量的技术核心是行为观察法，它是通过安排一定的情境，在其中观察特定个体（或群体）的特定行为，从中分析所要考查的内在素质或特征。行为观察法可以分为自然观察法、设计观察法和自我观察法。
⑴自然观察法。是观察者在真实的生活或工作情境中对个体的行为进行直接观察的方法。在企业中，可以尝试在考核中引进客观的自然观察方法。人事经理可以在考核前选定任意一个工作时段，在不被员工发觉的前提下对员工的工作行为进行观察，并作客观详细的记录，该记录资料可以作为考核的依据。
⑵设计观察。一般很难有机会在自然状态下遇到这种观察机会，这就需要采用设计观察法，即在人为设计的环境中观察特定的行为或反应。在人事测量领域经常用的设计观察方法有情境压力测验和模拟情境测验两种。
情境压力测验由主试向被观察者布置一定任务和作业，借以观察个体完成任务的行为。工作样本测验、无领导小组讨论都可算做情境压力测验。
工作样本测验中，主试通常向被试布置一项工作任务，要求被试在一定时间内完成，观察者对被试完成任务的行为过程和行为结果进行观察和评估。
无领导小组讨论是安排一组互不相识的应聘者（通常为6-8人）组成一个临时任务小组，并不指定任务负责人，请大家就给定任务进行自由讨论，并拿出小组决策意见。
无领导小组讨论可以对三方面的内容进行测量：
个人特点：自信心、挑战性、自我表现的主动性、主动寻求他人同意和赞赏的技巧等；
社交能力：言语表达的流畅性、组织性和逻辑性，对他人的说服力，倾听的技巧等；
领导意识和领导能力：主动扮演领导角色的倾向、对进程的控制能力、意见综合能力等。
模拟情境测验是指通过模拟一个尽可能接近真实工作情境的环境，要求被试完成某项任务，对被试的完成任务的行为过程及行为结果进行观察、评估。模拟情境测验与情境压力测验的唯一区别就是在模拟情境测验中被试处在一个假定的情境中，这个假定情境可以根据测验的需要不断变换，以充分考察被试在不同情境中的表现。
角色扮演测验是通过赋予被试一个假定的角色，要求按照角色的要求表现自己的行为，观察记录并评价角色扮演的行为，评价角色接近程度或胜任力。
⑶自我观察。是由被试自己对自己的行为进行观察，并记录自己行为的方法。有利于被试对自己行为的监控。企业中常采用的“工作日志”就是自我观察的一种应用。
⒌对行为模拟与观察类测量的评价。
行为模拟与观察类测量的最大弊端，是它*作的困难性。这类测量对主试的要求很高，且这类测量通常只能逐个进行，测量的成本很高。这类测验的结果分析也很复杂，分析过程容易有较大的人为化倾向，其客观性受到影响。
行为模拟与观察类测量具有如下优点：
⑴通过行为测量可以观测到被试在具体情境下的真实行为，比对行为的自我评估，其结果更容易令人信服。
⑵通过对情境的*作，可以使测试情境与将来的工作情境尽可能相似，所测量出的结果具有很好的预测效果。
⑶在行为测量中，被试的个人特点和能力可以得到充分的展示。通过对情境的设计，考官可以成功地观测到许多他所想要考察的行为和能力。
 如何建立人事测量工具
填空及选择
⒈要建立一项完善的人事测量工具，目标设定是第一步。
⒉根据测量目标确定测量的内容和形式：确定测量内容和形式是决定性的关键，它决定测量有效与否。
⒊根据测量的对象确定题目的形式：在编制测量工具时，还应该考虑使用测量工具的团体的组成和特点，如被试的年龄、智力水平、受教育程度、社会经济地位、文化背景、阅读水平等因素。测量工具针对的对象不同，测量工具采取的形式、题目的编写、测量题目的难度、取样的范围都可能有所不同。
⒋一般在客观题的测验中，为了可供筛选，编写出的题目应比实际需要多20%以上，如考虑到以后还要不断筛选和修改，初次编写的题目可以比实际需要的多出一倍到几倍。
⒌题目的编排：选择和编排过程包括定性的逻辑分析和根据预测的结果进行的定量分析。
⒍对题目进行初步选择的主要依据是：题目本身的性质、对预期测量目标的可测量程度。这一步可细分为如下几个步骤：
⑴检查题目是否符合细目表中某一单元格内容的要求；
⑵根据细目表对各部分所要求的比例选择适当数量的测试，使测量工具尽量覆盖整个细目表的内容；
⑶检查题目是否叙述明确清楚，是否提供了额外线索；
⑷检查题目十分适合将要施测的对象和施测的条件；
⑸检查题目的难度是否恰当，一般来说，难度定为0.50（50%的人答对此题）较为合适（对能力、技能类的题目要求除外）；
⑹检查所选择的题目是否彼此独立，没有重叠，即回答某一问题所需的知识与能否回答其他问题无关。
在选择题目时还要注意测量工具的长度。在一个测量工具里究竟包括多少题目比较合适，既要看是否能完全满足测量目的的要求，也要根据测量工具的时间限制和被试的年龄和阅读水平而定。
⒎题目的最佳编排的一般原则：
⑴将测量相同因素的测试题排列在一起；
⑵尽可能地将同一类型的测试题组合在一起；
⑶难度测验的题目应按由易到难排列；
⑷对于人格测验，应尽量避免将测量同一特质的题目编排在一起，防止被试猜测出题目所要测查的因素。
⒏对题目的选取只是依靠编写者的主观经验，题目的效果如何还需要进行定量的客观分析。这时的测试题还只能叫做预备测试题，还需要获取被试对这些题目的反应的材料，为进一步筛选题目和为编排测量工具提供客观依据。
必须将预备测试题对一定规模的小样本被试进行施测，获得数据以进行校验、修订。这一过程称为测试题的预测试。
⒐数据收集上来之后，就应该利用这些数据对题目进行分析，删除不好的题目或对题目进行修改，这个过程称为题目分析，具体内容包括对题目的项目分析和对测验信度、效度指标的检查。
⒑对测试题的预测试应注意以下问题：
⑴预测试对象必须和将来正式测试的对象相似；
⑵预测试的实施过程与情境应力求与将来正式测量工具实施时的情境相似；
⑶预测试的时限可稍宽些，最好使每个被试都能将题目答完，以便搜集充分的反应资料，使统计分析的结果更为可靠；
⑷在预测试过程中，应将被试的各种反映情况随时加以记录。题意不清之处，在修改测验时作为参考。
⒒根据预测结果进行题目分析，对每个题目的具体分析称为项目分析，主要是指根据题目的难度、区分度、备选答案的合适度等数量指标来对题目进行分析。
简答及论述
⒈显示性测量与预测性测量的区别与联系。
显示性测量反映被测者具有什么知识和特点，能完成什么任务。如成就测验、态度测验就是显示性测量。
预测性测量：工具帮助观测一个人在不同情境下的行为。如能力倾向测验可以预测个体将来的工作绩效。角色扮演、公文筐测验能够直接预测个体将来在同样的工作情境中的工作表现。
⒉目标分析与任务分析。
在实际过程中，测量工具的编制者还必须把测量目标转换成可*作的测量指标，这种转换过程称之为*作化或目标分析过程。
目标分析与测量目标是密切相关的。根据测量目的的不同，我们区别以下三个情况来具体分析：
⑴对于有选拔和预测功用的预测性测量工具，主要任务是要对所预测的行为活动做具体分析，故称之为任务分析或工作分析。包括两个步骤：首先要确定，为了使所预测的活动达到成功，需要哪些心理特质和行为。其次，还要建立衡量被试成功与否的标准，称之为效标。效标可以作为鉴别测量工具的预测是否有效的重要指标。
⑵如果测量工具用于测量一种特殊的心理品质或特质，首先必须给所要测量的心理和行为特质下定义，然后找出该特质往往通过什么行为表现出来。
⑶测量工具是描述性的显示测验，它的目标分析的主要任务则是确定所要显示的内容和技能，从中取样。成就测验就是一种典型的描述性显示测验。
双向细目表是一个由测量的内容材料维度和行为技能维度所构成的表格，它能帮助成就测量工具的编制者决定应该选择哪些方面的题目以及各类题目应占的比例。如果要检查新员工培训班的培训效果，那就需要采用成就测验。这种成就测验的内容，就可以利用双向细目表来确定。
⒊测验题目的来源。
收集题目的方法有很多，包括从现成的测验中选取、按照现有理论设计、请专家设计等。如编制态度测量量表，则有关态度的类型、定义等理论都有参考和指导作用。专家无疑是设计测验的重要资源。在收集题目时应注意几个问题：
⑴题目的来源要尽可能地丰富，这样测量内容不至于偏颇，并能提高行为样本的代表性；
⑵题目要有普遍性，尤其是成就测验，要保证所有施测对象都学过该测验中题目所包含的内容；
⑶在编制智力或能力等本身不应体现文化影响的内容的测量题目时，要尽量避免文化背景差异的影响。
⒋题目编写的原则。
对测量工具题目进行编写要遵从某些一般原则，这些原则可以归纳为内容、语言、表达与理解这四个方面。
 ⑴针对题目内容的原则。
要求题目的内容符合测量工具的目的，避免贪多而乱出题目；
内容取样要有代表性，符合测量工具计划的内容；
各个试题必须彼此独立，不可互相重复或牵连，切忌一个题目的答案影响对另一个题目的回答。
⑵针对题目语言的原则。
使用准确的当代语言，不要使用古僻艰深的词句；
文句简单扼要，既排除与解题无关的陈述，又不要遗漏解题的必要条件；
最好一句话说明一个概念，不要使用两个或两个以上的观念；
意义必须明确，不得暧昧或含糊，尽量少使用双重否定句。
⑶针对题目表达的原则。
尽量避免主观性和情绪化的字句；
不要伤害被试感情，避免涉及社会禁忌或隐私；
避免诱导和暗示答案；
避免令被试为难的问题。
⑷针对题目理解的原则。
题目应有确切答案，不应具有引起争议的可能；
题目内容不要超出受测团体的知识和能力范围；
题目的格式不要引起误解。
⒌题目的分类。
题目的种类很多，根据被试所作出的反应方式进行分类，可分为提供型和选择型题目。
⑴提供型题目：要求被试提供答案，如问答题、填充题。另外，各种*作性题目，如画图、表演、完成某项任务、回答问题等，都可算做提供型题目。
⑵选择型题目：要求被试在提供的备选答案中选择正确答案，如是非题、匹配题、选择题。
⒍测验题目可分为几种类型，并举例说明。
⑴问答题：指示语：试以2000字说明下述问题：①比较问答题和客观题的优劣；②解释进行课堂测量工具项目分析的理由。
⑵填充题：指示语：在每个空格内填上合适的字句：①客观测量工具的客观性的关键是：＿＿＿＿；②编制一个预测某种工作成功程度的测量工具的第一个步骤是：＿＿＿＿。
⑶是非题：指示语：如果该题正确，请在“是”上划“√”；若该题不正确，请在“否”上划“√”。是否①心理测量工具只是心理测量的方法之一。
⑷匹配题：指示语：请在右栏选择合适的答案的编号，填在左边每题的编号前。
＿＿①团体智力测量工具 a.比奈
＿＿②个体智力测量工具 b.达尔文
＿＿③兴趣问卷 c.高尔顿
＿＿④人格问卷 d.欧提斯
＿＿⑤线性相关 e.皮尔逊
＿＿⑥感知觉测量工具 f.罗夏克
g.斯皮尔曼
h.斯特朗
i.伍德沃斯
⑸选择题：指示语：下面哪个答案最合适？
＿＿①“决不”、“有时”、“总是”等定语，常常会对毫无所知的被试产生暗示作用。我们称这些词语为
a.普通修饰词 b.连词 c.反应定势 d.特殊决定词
⒎常用题目类型与编制要领。
⑴问答题。
优势：①较好编制，题目无需太多；
②不需准备备选答案，答案是由被试自己生成的；
③可以避免被试随机猜测答案的可能。
存在的问题：①问答题一般回答时间长，占分类大，因此题量不宜太大，所以能测量到的内容也有限，对行为的取样受到局限；
②问答题的评分标准也不容易标准化；
③问答题的评分容易受书写的整洁程度、个人成见等无关因素的影响。
在编制时应注意以下几点：
问题应清楚而且明确，使被试了解答题要求；
题目的数量不要太多，以免变成速度测验；
③在编制题目时应该有一个理想答案或一系列答题标准，同时对另外一些可接受的答案应有所规定和说明。
⑵选择题。
优点：①适用范围广，从一般知识到复杂能力的测量均可使用；
②题意明确，被试的反应简单，容易计分；
③与其他形式的客观题相比，更少受猜测和反应定势的影响，评分较为客观；
④选择题的题量可以较大，考察的范围更广，取样代表性较高。
选择题的不足之处：①诱答难以编制，诱答的数量要求多，而且还要似是而非，让那些不知道正确答案的被试感到无从选择；②通过选择题较难测出个体组织能力、表达能力和创造性等特点。
编制选择题的一般原则：
题干所提出的问题必须明确，使用简单而且清晰的用词。做到即使被试不看选项的情况下，题干本身的意义也是完整的。
不要将选项夹在题干中间，或者在题干前出现与问题无关的材料；
选项要简练，尽量将选项**同的词句移至题干中。这样不仅可以使题意清楚，而且可以减少被试的阅读时间。
⑶是非题。
缺点：①容易受被试反应定势和猜测的影响；
②是非题仅有两种答案，即使猜测，也有50%答对的可能性。弥补这一缺陷的方法之一，是加大题目数，使每一题目分数的偶然性对总分的影响相对减小。
反应定势是指部分被试在回答问题时，其答案的选择建立在题目的形式或位置上（如偏向正面回答或否定回答），而不是建立在题目内容的基础之上。
是非题也有其长处。它能很快书写和阅读，因此题量可以较大，便于广泛取样；记分也比较客观。在能力测验中，是非题多用于只需快速粗略判断被试能力的情况。在人格测验中，多用于只需判断一般普遍行为的问卷中。
编写是非题时要注意以下几点：
测查的内容应以有意义的事实、概念或原理为主，不要考察被试对无关紧要的问题或琐碎的细节的辨别能力。
每道题只能包括一个重要的概念，避免两个以上的概念出现在同一题目中，造成“半对半错”或“似是而非”的情况。且还要把各个概念放在题干的重要位置上。
决定一个题目是否正确，应以重要的概念为基础，不要着重于对次要的或琐碎的观念的判断。
除特殊情况，尽量避免否定的叙述，尤其要避免双重否定的叙述。
测验中正确的题目与错误的题目，它们的长度、复杂性应尽量一致。
正确的题目数与错误的题目数应该基本相等，两种题目应按随机方式排列。
⑷匹配题。一般包括多个反应项（匹配项）和多个刺激项（被匹配项），用反应项来匹配刺激项。匹配题有完全匹配（刺激项与反应项的数量相等）和不完全匹配（反应项目多于刺激项目）两种形式。通常，刺激项目和反应项目分别排成两列。
好处：匹配题容易编制，而且可以在短时间内测量大量相关联的材料，覆盖面较广。但它一般只能测量简单记忆的事实材料或概念关系，并且要求编制的选项必须是同质的。
对编制匹配题的一些建议：
刺激项目和反应项目应该分成两列，通常反应项安排在右边；
配对数目不可过多或过少，最好使用不完全匹配，使反应项数目多于刺激项数目，并且最好不限制每个反应项被选择的次数，这样可以降低猜测的概率；
匹配题的反应项与刺激项，其性质必须相近；
应对匹配方法、匹配的依据加以明确的规定和说明，同时说明反应项可以被选择的次数；
同一组的反应项与刺激项最好印在同一页纸上，以免造成答题时间的浪费；
反应项与刺激项应以不同形式的序号加以标识，以免混淆。
⑸填充题：编制填充题时应注意的几个方面：
最好采用问句形式；
使用直接问句的形式，可避免产生对题意的误解；
如果是填空形式，填充处不可太多。过多空白会使题意不明确；
每题最好只有一个答案，答案最好简短而具体，有利于评分。
⑹*作性测量形式。*作测试题要求被试对未来真实情境中的行为进行模拟，其真实性要高于纸笔测验。*作性测试题通常分为着重过程和着重结果两种形式。
*作性测试有多种不同的分类方法，按测试情境的真实性程度可分：①纸笔的*作性测试：虽用纸笔但偏重于模拟情境下知识的应用，如编制某项*作计划、步骤、注意事项等，如公文筐测验；②模拟*作测试：强调正确的程序，被试需要在模拟情境下完成与真实活动相同的动作，如驾驶员的考核等；③工作样本*作测试：其真实性最高，但是是在有控制的条件下去完成的。如司机在标准场地内的考核。
设计*作性测试题的主要原则有：
明确所要测量的目标，并将其*作化。即要进行工作分析，辩认出*作中最重要的因素，找出具有代表性的工作样本。
要建立作业标准，规定通过此项作业的最低标准。这些都应该*作化。
选择合适的真实性程度。通常情况下，真实性程度越高，模拟的代价越大。
指示语简单明确，让被试知道要干什么和在什么条件下去做。
有明确的计分方法。
作品量表一般包括一系列按顺序排列的不同作业程度、水平、质量的标准样本，评分时参照这些标准样本对被试结果进行评分。
⑺面试。缺点：①面试的考核缺乏心理测量学的严格性，易受考官的个人偏见或歧视的影响；②由于面试既要看应试者对问题回答的内容、质量，还要看整个面试过程中的行为表现，如情绪紧张度、应变能力等，更加大了面试记分的难度。面试效果的好坏往往取决于面试考官。
面试应注意：①面试考官必须对面试主题有充分的了解，对于所要求的反应有清晰的认识；②用于描述或评定被试反应的词语，必须具体化，避免模糊不清的陈述。
⒏编制测验的步骤。
⑴确定测验目的；⑵确定测验性质；⑶确定测验内容；⑷制订测验计划；⑸筛选题目；⑹测验的标准化；⑺对测验的技术分析和鉴定；⑻编写测验指导书。
人事测量的实施与计分
填空及选择
⒈编题时要注意的要点：在能力和成就测验中所使用的时限，以大约90%的被试能在规定时间内完成测验为标准。
⒉标准化测量要求对测验结果进行客观计分。检验客观与否，可以以两个或两个以上受过训练的合格评分者所评结果之间的一致性作为指标。一般情况下，受过训练的评分者之间的平均一致性达到90%以上，我们就认为计分是客观的。
名词解释
指示语是在测量实施时说明测量进行方式以及如何回答问题的指导性语言。指示语通常有两种：一种是对被试的，另一种是给主试的。

简答及论述
⒈主试的职责。
主试，也称考官或主考人，是控制测试进程的主要人员。主试的经验如何往往会对测验的结果产生影响。对于个体测验、投射类测验、*作性测试和面试，主试的作用就更为重要。主试应做以下工作：
⑴测验前的准备工作。
预告测验。事先通知被试；
熟悉测验指示语。
准备测验材料。
熟悉测验的具体程序。
确保满意合适的测验环境。调整光线、通风、噪音水平等物理条件。另外，为防止作弊，还要妥善安排座位等。
⑵测验中主试的职责。
在测验中，主试的主要职责是按照指示语的要求实施测验，在被试询问指示语意义时，作进一步澄清，但注意不要作任何暗示。主试还要注意不要讲与测验无关的话。
⑶建立协调关系。
协调关系指的是主试和被试之间一种友好的、合作的、能促使被试最大限度地做好测验的一种关系。
⒉主试对测量结果的影响。
⑴主试的人格特点。
主试的不同特点对测验的实施及测验的评分等各环节都有影响。有些主试可能自己就不大善于建立和处理人际关系，对他来说在测验实施过程中与被试建立协调关系较为困难，因而由他施测的被试的测验结果可能就会受到影响。
⑵主试的期望。
在有些情况下，实验者所获得的资料及实验结果会受其本身期望的影响，这种现象称为罗森塔尔效应，也称实验者期望误差。
主试对测验结果的影响仍是有限的，是可以通过一定方法有效克服的。要力求做到测验实施过程的标准化，将主试的个人因素对测验结果的影响尽可能降到最低。
⒊被试特点对测量结果的影响。
⑴测验的技巧与练习因素。
测验的技巧。必要时，可以增加练习测验，使所有应试者同等程度地熟悉测验形式。
练习效应。练习因素所产生的影响可归纳为以下几点：
教育背景较差和经验较少者，其受练习因素的影响较为显著；
着重速度的测验，练习效果较为明显；
重复实施相同的测验，受练习影响的程度要大于施测复本测验；
练习的影响仅限于第一次及第二次重测，第二次以后的影响微不足道；
平均而言，练习因素影响的幅度约在0.2个标准差以下。
⑵焦虑和动机因素。
应试动机。被试参加测验的动机不同，会影响其回答问题的态度、注意力、持久性以及反应速度等，从而影响最后测量结果。
测验焦虑。焦虑是一种不愉快的、表现为焦急、恐惧和紧张的情绪体验，它主要是由于对可能出现的测验结果的担心或对应付测验结果的能力的担心而造成。大多数人在测验前和测验中感到焦虑，故又称测验焦虑或考试焦虑。
⑶反应定势。
也称反应的方式或反应风格，简单地说，就是每个人回答问题的习惯方式。由于每个人回答问题的习惯不同，可能会使有相同能力的被试获得不同的分数。影响测量结果的反应定势主要有以下几种：
求“快”与求“精确”的反应定势。有些被试反应特别谨慎，体现为求“精确”的反应定势；另外有些人则特别快而且粗心大意，这就是求“快”的反应定势。
反应时间应以90%的被试可以答完所有试题为准。
偏好正面叙述的反应定势。被试在无法确定“是非题”的正确答案时，选“是”的人多于选“非”的人。这种定势又称肯定反应定势。
偏好特殊位置的反应定势。被试如果完全不知道选择题的正确答案，则不会以完全随机的方式来决定该选择哪一个选项，而有偏好某一个位置的选项的倾向，也称位置定势。
偏好较长选项的反应定势。有人发现被试在无法确定正确答案时，有偏好选择较长选项的反应定势。
猜测的反应定势。
⒋猜测的校正。
⑴猜测修正的方法。
S=R-W/(n-1) 
其中，S是正确分数，R为被试答对的题目数，W为被试答错的题目数，n选项数目。

⑴针对题目内容的原则。
要求题目的内容符合测量工具的目的，避免贪多而乱出题目；
内容取样要有代表性，符合测量工具计划的内容；
各个试题必须彼此独立，不可互相重复或牵连，切忌一个题目的答案影响对另一个题目的回答。
⑵针对题目语言的原则。
使用准确的当代语言，不要使用古僻艰深的词句；
文句简单扼要，既排除与解题无关的陈述，又不要遗漏解题的必要条件；
最好一句话说明一个概念，不要使用两个或两个以上的观念；
意义必须明确，不得暧昧或含糊，尽量少使用双重否定句。
⑶针对题目表达的原则。
尽量避免主观性和情绪化的字句；
不要伤害被试感情，避免涉及社会禁忌或隐私；
避免诱导和暗示答案；
避免令被试为难的问题。
⑷针对题目理解的原则。
题目应有确切答案，不应具有引起争议的可能；
题目内容不要超出受测团体的知识和能力范围；
题目的格式不要引起误解。
⒌题目的分类。
题目的种类很多，根据被试所作出的反应方式进行分类，可分为提供型和选择型题目。
⑴提供型题目：要求被试提供答案，如问答题、填充题。另外，各种*作性题目，如画图、表演、完成某项任务、回答问题等，都可算做提供型题目。
⑵选择型题目：要求被试在提供的备选答案中选择正确答案，如是非题、匹配题、选择题。
⒍测验题目可分为几种类型，并举例说明。
⑴问答题：指示语：试以2000字说明下述问题：①比较问答题和客观题的优劣；②解释进行课堂测量工具项目分析的理由。
⑵填充题：指示语：在每个空格内填上合适的字句：①客观测量工具的客观性的关键是：＿＿＿＿；②编制一个预测某种工作成功程度的测量工具的第一个步骤是：＿＿＿＿。
⑶是非题：指示语：如果该题正确，请在“是”上划“√”；若该题不正确，请在“否”上划“√”。是否①心理测量工具只是心理测量的方法之一。
⑷匹配题：指示语：请在右栏选择合适的答案的编号，填在左边每题的编号前。
＿＿①团体智力测量工具 a.比奈
＿＿②个体智力测量工具 b.达尔文
＿＿③兴趣问卷 c.高尔顿
＿＿④人格问卷 d.欧提斯
＿＿⑤线性相关 e.皮尔逊
＿＿⑥感知觉测量工具 f.罗夏克
g.斯皮尔曼
h.斯特朗
i.伍德沃斯
⑸选择题：指示语：下面哪个答案最合适？
＿＿①“决不”、“有时”、“总是”等定语，常常会对毫无所知的被试产生暗示作用。我们称这些词语为
a.普通修饰词 b.连词 c.反应定势 d.特殊决定词
⒎常用题目类型与编制要领。
⑴问答题。
优势：①较好编制，题目无需太多；
②不需准备备选答案，答案是由被试自己生成的；
③可以避免被试随机猜测答案的可能。
存在的问题：①问答题一般回答时间长，占分类大，因此题量不宜太大，所以能测量到的内容也有限，对行为的取样受到局限；
②问答题的评分标准也不容易标准化；
③问答题的评分容易受书写的整洁程度、个人成见等无关因素的影响。
在编制时应注意以下几点：
问题应清楚而且明确，使被试了解答题要求；
题目的数量不要太多，以免变成速度测验；
③在编制题目时应该有一个理想答案或一系列答题标准，同时对另外一些可接受的答案应有所规定和说明。
⑵选择题。
优点：①适用范围广，从一般知识到复杂能力的测量均可使用；
②题意明确，被试的反应简单，容易计分；
③与其他形式的客观题相比，更少受猜测和反应定势的影响，评分较为客观；
④选择题的题量可以较大，考察的范围更广，取样代表性较高。
选择题的不足之处：①诱答难以编制，诱答的数量要求多，而且还要似是而非，让那些不知道正确答案的被试感到无从选择；②通过选择题较难测出个体组织能力、表达能力和创造性等特点。
编制选择题的一般原则：
题干所提出的问题必须明确，使用简单而且清晰的用词。做到即使被试不看选项的情况下，题干本身的意义也是完整的。
不要将选项夹在题干中间，或者在题干前出现与问题无关的材料；
选项要简练，尽量将选项**同的词句移至题干中。这样不仅可以使题意清楚，而且可以减少被试的阅读时间。
⑶是非题。
缺点：①容易受被试反应定势和猜测的影响；
②是非题仅有两种答案，即使猜测，也有50%答对的可能性。弥补这一缺陷的方法之一，是加大题目数，使每一题目分数的偶然性对总分的影响相对减小。
反应定势是指部分被试在回答问题时，其答案的选择建立在题目的形式或位置上（如偏向正面回答或否定回答），而不是建立在题目内容的基础之上。
是非题也有其长处。它能很快书写和阅读，因此题量可以较大，便于广泛取样；记分也比较客观。在能力测验中，是非题多用于只需快速粗略判断被试能力的情况。在人格测验中，多用于只需判断一般普遍行为的问卷中。
编写是非题时要注意以下几点：
测查的内容应以有意义的事实、概念或原理为主，不要考察被试对无关紧要的问题或琐碎的细节的辨别能力。
每道题只能包括一个重要的概念，避免两个以上的概念出现在同一题目中，造成“半对半错”或“似是而非”的情况。且还要把各个概念放在题干的重要位置上。
决定一个题目是否正确，应以重要的概念为基础，不要着重于对次要的或琐碎的观念的判断。
除特殊情况，尽量避免否定的叙述，尤其要避免双重否定的叙述。
测验中正确的题目与错误的题目，它们的长度、复杂性应尽量一致。
正确的题目数与错误的题目数应该基本相等，两种题目应按随机方式排列。
⑷匹配题。一般包括多个反应项（匹配项）和多个刺激项（被匹配项），用反应项来匹配刺激项。匹配题有完全匹配（刺激项与反应项的数量相等）和不完全匹配（反应项目多于刺激项目）两种形式。通常，刺激项目和反应项目分别排成两列。
好处：匹配题容易编制，而且可以在短时间内测量大量相关联的材料，覆盖面较广。但它一般只能测量简单记忆的事实材料或概念关系，并且要求编制的选项必须是同质的。
对编制匹配题的一些建议：
刺激项目和反应项目应该分成两列，通常反应项安排在右边；
配对数目不可过多或过少，最好使用不完全匹配，使反应项数目多于刺激项数目，并且最好不限制每个反应项被选择的次数，这样可以降低猜测的概率；
匹配题的反应项与刺激项，其性质必须相近；
应对匹配方法、匹配的依据加以明确的规定和说明，同时说明反应项可以被选择的次数；
同一组的反应项与刺激项最好印在同一页纸上，以免造成答题时间的浪费；
反应项与刺激项应以不同形式的序号加以标识，以免混淆。
⑸填充题：编制填充题时应注意的几个方面：
最好采用问句形式；
使用直接问句的形式，可避免产生对题意的误解；
如果是填空形式，填充处不可太多。过多空白会使题意不明确；
每题最好只有一个答案，答案最好简短而具体，有利于评分。
⑹*作性测量形式。*作测试题要求被试对未来真实情境中的行为进行模拟，其真实性要高于纸笔测验。*作性测试题通常分为着重过程和着重结果两种形式。
*作性测试有多种不同的分类方法，按测试情境的真实性程度可分：①纸笔的*作性测试：虽用纸笔但偏重于模拟情境下知识的应用，如编制某项*作计划、步骤、注意事项等，如公文筐测验；②模拟*作测试：强调正确的程序，被试需要在模拟情境下完成与真实活动相同的动作，如驾驶员的考核等；③工作样本*作测试：其真实性最高，但是是在有控制的条件下去完成的。如司机在标准场地内的考核。
设计*作性测试题的主要原则有：
明确所要测量的目标，并将其*作化。即要进行工作分析，辩认出*作中最重要的因素，找出具有代表性的工作样本。
要建立作业标准，规定通过此项作业的最低标准。这些都应该*作化。
选择合适的真实性程度。通常情况下，真实性程度越高，模拟的代价越大。
指示语简单明确，让被试知道要干什么和在什么条件下去做。
有明确的计分方法。
作品量表一般包括一系列按顺序排列的不同作业程度、水平、质量的标准样本，评分时参照这些标准样本对被试结果进行评分。
⑺面试。缺点：①面试的考核缺乏心理测量学的严格性，易受考官的个人偏见或歧视的影响；②由于面试既要看应试者对问题回答的内容、质量，还要看整个面试过程中的行为表现，如情绪紧张度、应变能力等，更加大了面试记分的难度。面试效果的好坏往往取决于面试考官。
面试应注意：①面试考官必须对面试主题有充分的了解，对于所要求的反应有清晰的认识；②用于描述或评定被试反应的词语，必须具体化，避免模糊不清的陈述。
⒏编制测验的步骤。
⑴确定测验目的；⑵确定测验性质；⑶确定测验内容；⑷制订测验计划；⑸筛选题目；⑹测验的标准化；⑺对测验的技术分析和鉴定；⑻编写测验指导书。
人事测量的实施与计分
填空及选择
⒈编题时要注意的要点：在能力和成就测验中所使用的时限，以大约90%的被试能在规定时间内完成测验为标准。
⒉标准化测量要求对测验结果进行客观计分。检验客观与否，可以以两个或两个以上受过训练的合格评分者所评结果之间的一致性作为指标。一般情况下，受过训练的评分者之间的平均一致性达到90%以上，我们就认为计分是客观的。
名词解释
指示语是在测量实施时说明测量进行方式以及如何回答问题的指导性语言。指示语通常有两种：一种是对被试的，另一种是给主试的。
简答及论述
⒈主试的职责。
主试，也称考官或主考人，是控制测试进程的主要人员。主试的经验如何往往会对测验的结果产生影响。对于个体测验、投射类测验、*作性测试和面试，主试的作用就更为重要。主试应做以下工作：
⑴测验前的准备工作。
预告测验。事先通知被试；
熟悉测验指示语。
准备测验材料。
熟悉测验的具体程序。
计算：一份试卷由100个客观题组成，每题1分，每个客观题都有5个备选项，甲应试者完成了整份试卷，答对了70题，请问猜测修正后，甲得62.5分。另有乙完成了90题，也答对了70题，乙得65分。S甲=70-30/（5-1）=62.5；S乙=70-20/（5-1）=65。
⑵猜测修正的优缺点。
赞成使用猜测修正公式的人认为：
修正公式可避免减低测验的信度。
修正公式可以反映被试真正的能力水平。
使用修正公式对那些不能答完全部试题的被试来说比较公平。
反对使用猜测修正公式的人则认为：
公式假设不成立，答错试题，是因为观念模糊、记忆不清或粗心大意，并非乱猜。
只要所有被试能答完全部题目，或者是略去未答的题目数相同，则猜测修正无实质作用。
未采用猜测修正对信度并无重大影响。
实际生活中，常常需要仅凭部分知识来作判断，因此完全不许猜测也与实际生活不符。
⑶在编制测题时要注意：
选项数目要多，4-5项较合适；
题目数量加多；
时间要充裕；
经常以项目分析评鉴试题，并淘汰不好的试题。
⒌计分的一般程序。
⑴计分的基本步骤主要有三步：
①记录反应。②检索标准答案。③反应和标准答案的比较。
⑵问答题计分。
问答题的主要缺点是评分不够客观，也就是说问答题的计分经常受到评分者的情感、态度的影响。问答题中常见的误差有：宽容定势和晕轮效应。宽容定势指主试的计分过于宽松，即使没有回答出题目所要求的答案，评分者也给予较高的分数；晕轮效应指给予被试某道题较高分数仅仅是由于被试在另外一些试题上获得了高分，也就是说对被试的一般印象影响到具体某个问题的评价。
为了使问答题的计分更加客观和可信，主试应该首先考虑采用何种计分程序：整体计分还是分析计分。整体计分就是评分者根据总体印象给答案评一个总分。整体计分在实际中应用较为普遍。分析计分是给问答题的不同部分分派不同的权数，按照各部分的要求对答案中所包括的信息和技能评分，最后将各部分的权数和得分组合起来得到该问答题的分数。分析计分往往有答题的详细标准。
⑶客观题计分。
客观题的一个主要优点就是计分简单、客观。
信心权数：多大程度上在给出的答案是正确的。伊贝尔是非题加权方法是信心权数应用。

林の声音 · 发表于 2005-11-30 02:52:48

人事测量结果的解释
填空及选择
⒈人事测量的解释不同于测量实施本身，它们是测量中两个不同的、相对独立的成分，即测量过程与结果评价是相对分离的。测量实施的主要目的是获得应试者的各种反应信息，而分数的解释是利用这些反应信息对个体的素质或特点作出评价的过程。
⒉人事测量的目的在于评价和比较应试者各方面的素质和特点。
⒊确定常模样本的过程包括：确定一般总体、确定目标总体、确定常模样本三个步骤。
⒋在最终确定常模样本的结构时，有许多可能的影响因素是需要考虑的。测验性质的不同，文化教育水平不同，性别的不同，都可能影响常模。
⒌常用的常模有发展常模、百分位常模和标准分数常模。
百分位常模包括百分等级、四分位数和十分位数。
PR=100-100×(R-0.5)/N
计算：某企业对所有400名职员进行了某项技能考核，总分为100分，员工最高得分为99分，最低得分为40分，甲得了75分，在所有员工中排160名，请问甲的百分等级PR=60.13。由于400个数据较多，作分组统计，分40-49，50-59，60-69，70-79，80-89，90-99共6组，70-79分组中有8人次，70分以下的共248人次，求甲的PR=63。
未分组：PR=100-100*（160-0.5）/400=60.13
分组：PR=100/400*[（75-70）*8/10+248]=63
⒍常见的标准分数有：z分数、Z分数、离差智商(IQ)、T分数、标准九分等。由原始分数转换的标准分数，又分为线性转换和非线性转换两种。
z分数是指以标准差为单位所表示的原始分数与平均数的差距。z=(X-X)/SD，Z=A+Bz
当原始分数不呈正态分布时，进行面积转化，而使分数转成为正态分布。由这种方式所得到的分数就叫正态化的标准分数。正态化过程主要是先将原始分数转化为百分等级，再将百分等级转化为正态分布上相应的离均值，并可以表示为任何平均数和标准差。
T分数：用Ｔ分数来表示任何正态化与非正态化的转化标准系统。
标准九分是另一较知名的标准分数系统，其量表是一个9级的分数量表。它以5为平均数，以2为标准差。
名词解释
⒈测量的解释是一个相当复杂的系统程序，它是以一系列复杂的统计工作为基础的，并在很大程度上依赖于专业人士的脑力劳动。
⒉原始分数是通过将应试者的反应与标准答案相比较而直接获得的，其本身并不具有多大的实用意义，而只是一个理论上的过渡值。
⒊原始分数通过与常模的比较，可以转换成等值的导出分数，叫做标准分。
⒋参照常模解释分数通常是将应试者的分数与某个参照团体的分数进行比较，并以该分数在这个团体中的相对等级或相对高低位置来描述应试者的素质或特点。
简答及论述
⒈比较常模参照解释和效标参照解释。
由测量的原始分数通过与常模的对照得到可供比较的导出分数的过程，就是测验分的解释形式之一，称为测量分数的常模参照解释。
测量分数的另一种解释方式是参照效标的分数解释，即效标参照解释，它是依据外在效标作为标准来对应试者的分数进行解释。
常模参照解释与效标参照解释的区别在于：常模参照解释是将应试者的成绩与同类群体的其他人（常模样本）的成绩进行比较，而效标参照解释是将应试者成绩与外在效标进行比较。
⒉常模样本的条件。
在确定和选择常模样本时，要注意下列要求：
⑴常模样本的构成必须明确。
在选取常模样本时，首先要保证常模样本的所有成员是同质的。
⑵常模样本必须是所测群体的代表性样本。
常模样本应能够代表测验总体，常模样本的分数分布应尽量与总体分数分布相吻合。
⑶样本大小要适当。
常模样本大小由以下三方面决定：
常模样本大小决定于总体的规模。总体规模小，常模样本应包括所有总体成员。如果总体数目大，相应的样本也应较大。
常模样本大小决定于总体性质。总体只有单一性质，则适当数目的样本就能够反映总体性质。总体性质越复杂，越需要较大数量的样本。
常模样本大小决定施测结果。希望提高样本的准确度，也就是说减小样本的标准误，则样本数目应随之扩大。样本大小适当的关键是样本要有代表性。
⑷注意常模的时效性。常模必须定期修订。
⒊取样的方法。
取样是指从目标人群中选择有代表性的样本的过程。从统计角度看，取样的方法有随机抽样和非随机抽样两种。在确定常模时，常用的取样方法有：
⑴简单随机抽样。
按照随机顺序表选择被试作为样本，或者是将抽样范围中的每个人或者每个抽样单位编号，随机选择，以避免由于标记、姓名或者其他社会赞许性偏见造成抽样误差。
⑵系统抽样。
具体方法：假设总体数目为N，若要选择K分之一的被试作为样本，则可以把所有的人N分为N/K组，每个组选一个人，则刚好组成1/K的样本。或者把所有的人从1到N按序编号，把所有编号是K的倍数的人抽取出来，即可组成所需样本。
需注意的是，在进行系统抽样时，分组和从组中抽取，或者是编号，都必须是随机的。
⑶分组抽样。
在总体数目较大，无法编号，并且总体成员又具有多样性的情况下，可以先将群体分为一定的小组，再从小组内随机抽样。
⑷分层抽样。
在确定常模样本时，最常用的是分层抽样方法。分成若干层次，再从各层次中随机抽取若干个案。
优点：分层抽样能够避免简单随机抽样中样本集中于某种特性或缺少某种特性的现象。它使各层次差异显著，同层次保持一致，增加了样本的代表性。使用分层抽样方法获得的常模在解释测验分数时更为实用和有效。
分层抽样的两种方法：①分层比例抽样法：如果各层抽取的个案数目ni是根据各层的个案数目Ni占总体数目N的比例而决定的。ni＝Ni/N×n
②分层非比例抽样：有些层次的重要性大于其他层次，这时应该采用非比例抽样方法。
⒋常模的表示方法。
常模表示的方法主要有两种：转化表和剖析图。
⑴转化表。
最简单而且最基本的表示常模的方法就是转化表，也叫常模表，它由原始分数表、相对应的导出分数表和对常模样本的具体描述等三个要素组成。
根据转化表进行解释时，必须注意：常模转化表总是特异性的，即一个转化表总是来自特定的常模样本的，这种转化表只能表示被试在常模样本内的相对等级，若要依此作出某种结论或预测，需要进一步的信度和效度的依据。
⑵剖析图。
是测验分数的转换关系用图形表示出来的一种模式图。可以很直观地看出被试在测验以及测验的各个子测验或维度上的分数及其相对的位置。
要注意的一个问题是，使用剖析图容易夸大各个测验间分数的差异。为避免这个问题，有些剖析图注明了多少距离代表两分数间差异显著。
⒌内容参照分数和结果参照分数有什么不同？它们的意义是什么？
效标参照测验关心的是应试者是否达到了某种标准或效标。参照效标的分数解释分为内容参照分数的解释及结果参照分数的解释两种类型。
⑴内容参照分数的测量目的是确立应试者对某个确定材料内容或技能的掌握和熟悉程度的分数。
编制内容参照测验量表的关键是预先制定一个判断应试者是否已掌握某种内容或技能的熟练程度的标准。这种标准可以通过掌握分数和正确百分数来表示。掌握分数通常以80%-90%的人能通过的分数作为最低分数。
⑵结果参照分数是将效标材料直接结合到测验结果的解释过程而进行评价的分数。预测性测验往往适合用结果参照分数进行解释。结果参照分数可以表示获得某个分数的应试者达到某种效标水平的可能性。
人事测量的关键技术：信度
填空及选择
⒈信度主要是指测量结果的可靠性或一致性。
⒉信度高低的指标通常以相关系数表示，称为信度系数。信度系数一般是同一样本所得的两组资料的相关，在理论上表示为实得分数与真实分数相关的平方：rxx=rxr2=ST2/SX2
⒊信度系数的分布是从0.00-1.00的正数范围，代表了从缺乏信度到完全可信的所有状况。说明可以接受的信度水准，一般来说，当rxx＜0.70时，不能用测验对个人作评价，也不能在团体间作比较；当rxx＞0.70时，可用于团体间比较；rxx＞0.85时，可用于鉴别个人。
 简答及论述
⒈信度类型和相应的评估方法。
⑴重测信度又称为稳定性系数，它的计量方法是采用重测法：用同一测验，在不同时间对同一群体施测两次，这两次测量分数的相关系数即为重测系数。
在进行重测信度的评估时，应注意两个重要问题：
重测信度一般只反映由随机因素导致的变化，而不反映被试行为的长久变化；
不同的行为受随机误差影响不同。
⑵复本信度，它是以两个测验复本来测量同一群体，然后求得应试者在这两个测验上得分的相关系数。复本信度的高低反映了这两个测验复本在内容上的等值性程度。两个等值的测验互为复本。
计算复本信度的主要目的在于考察两个测验复本的题目取样或内容取样是否等值。主要优点在于：
能够避免重测信度的一些问题，如记忆效果、练习效应等；
适用于进行长期追踪研究或调查某些干涉变量对测验成绩影响；
减少了辅导或作弊的可能性。
复本信度的局限性：
如果测量的行为易受练习的影响，则复本信度只能减少而不能消除这种影响；
有些测验的性质会由于重复而发生改变；
有些测验很难找到合适的复本。
⑶内部一致性信度，重测信度和复本信度分别注重考虑测量跨时间的一致性和跨形式的一致性，而内部一致性信度系数主要反映的是测验内部题目之间的关系，考察测验的各个题目是否测量了相同的内容或特质。内部一致性信度又分为分半信度和同质性信度。
分半信度是通过将测验分成两半，计算这两半测验之间的相关性而获得的信度系数。采用这种方法估计信度系数。
同质性信度是指测验内部的各题目在多大程度上考察了同一内容。同质性信度低时，即使各个测试题看起来似乎是测量同一特质，但测验实际上是异质的，即测验测量了不止一种特质。同质性分析与项目分析中的内容一致性分析相类似。在某些情况下，也可以作为效度的一种指标。
⑷评分者信度是指不同评分者对同样对象进行评定时的一致性。最简单的估计方法就是随机抽取若干份答卷，由两个独立的评分者打分，再求每份答卷两个评判分数的相关系数。这种相关系数的计算可以用积差相关方法，也可采用斯皮尔曼等级相关方法。
⒉影响信度的因素。
对测验的信度造成影响的因素主要有：样本团体的性质、测验的长度、测验难度。
⑴样本团体的性质。
样本团体的分数分布：分数分布越广，信度系数就相对越高，分数分布越窄，信度系数就会越低。
样本团体的异质性：取样团体的异质性越大，信度系数就相对越高。
不同团体间能力水平的差异。
⑵测验的长度。
测验越长，信度值越高。一方面，测验越长，题目取样或内容取样就越充分，结果就越可靠。另一方面，较长的测验也不容易受到猜测的影响。
⑶测验的难度。
如果一个测验的难度太低，测验分数会非常集中并聚在高分端，即出现天花板效应，或者难度太大，所有分数都集中在低分端，出现地板效应，都会使测量到的分数分布太窄，导致信度降低。只有当测验的难度水平能够使测验分数分布范围最大时，测验的信度才会比较理想。一般来说，当所有被试的平均分为测验总分的一半，并且分数从零分到满分分布时，测量的信度最高。
人事测量的关键技术：效度
填空及选择
⒈测量的效度就是指测量的有效性，即能测量到所要测量的目标的程度。
⒉效度的性质：效度是连续性的，效度高低只是程度上的差别，它不是“全有”或“全无”的变量。
⒊影响效度的因素：测验的因素、样本团体的性质和效标的性质。
测验的因素：⑴测验题目的质量；⑵实施测验时的干扰因素；⑶被试的影响因素；⑷测验的长度：一般来说，增加测验的长度通常可以提高测验的信度，增加测验的题目往往也能提高测验的效度。测验长度对效度的影响：r(nx)y=nrxy/ n(1-rxx+nrxx)其中，r(nx)y为测验增长到原来的n 倍后，测验(x)与效标(y)的相关（即增长后的效度系数）；n为测验增长的倍数；rxy为原测验的效度系数；rxx为原测验的信度系数，根据公式中以推知，要达到满意的效度水平，测验题目需要增加几倍。
效标的性质：一般来说，如果其他条件相同，所测量的行为或心理特质与效标行为或特质越相似，效度系数就越高。效标与测验分数之间的关系是否线性也是一个很重要的影响因素。如果测验分数与效标之间的关系是非线性的，采有皮尔逊积差相关将会低估相关的大小，造成效度的低估。
名词解释
效度：与测量目标有关的真实分数方差与总分方差的比率。rXY=SV2/SX2其中，rXY为测验效度；SV2为有效方差；SX2为总方差。
简答及论述
⒈信度和效度的关系。
⑴信度主要是指测量结果的可靠性或一致性。
效度指测量的有效性，即能测量到所要测量的目标的程度。
⑵信度和效度的差别在于所考虑的误差不同。信度考虑的是随机误差的影响；效度的误差则还包括对测验目的来说无关的变量所引起的系统误差。
误差方差低（即信度高）并不保证效度就一定高；但效度高的话，信度必然要高。信度是效度的必要条件。
⒉如何评估人事测量的效度。
效度可以分为内容效度、构想效度和效标关联效度三类。
⑴内容效度是检查测验内容是否是所欲测量的行为领域的代表性取样的指标。如成就测验往往采用内容效度的评估方法。
内容效度分析时要注意两方面问题：
应避免将测验取样的行为领域过于泛化；
要注意测验分数中无关因素的影响。
较好的内容效度依赖于两个条件：
测验内容范围明确；
测验内容的取样有代表性。
效标参照测验应用的基本条件是具备足够的内容效度。
⑵效标关联效度。
也称效标效度，反映的是测验分数与外在标准的相关程度，即测验分数对个体的效标行为表现进行预测的有效性程度。
效标是考察测验效用的外在参照标准。根据效标材料收集的时间不同，可将效标进一步区分为预测效度和同时效度：
预测效度的效标资料往往是测量结束后隔一段时间才获得，它反映的是由测验分数对任一段时间间隔后被试行为表现的预测程度。预测效度适用于那些对人员进行选拔、分类和安置的人事测验，这些测验需要对应试者将来的工作绩效进行可靠的预测。
同时效度的效标材料可以和测验分数差不多同时搜集。有时，同时效度可以替代预测效度。
效标是衡量测验有效性的参照标准，是一种可以直接、独立测量的行为。效标的概念可以细分为观念效标，（即效标的实质概念内容）和效标测量（即效标的具体度量方法）。
效标污染是指由于评定者知道测验分数而影响个人的效标成绩的情形。
常用的效标：学术成就、特殊训练成绩、实际工作表现、团体对照、等级评定（评定可以作为任何测验的效标）和先前有效的测验。
⑶构想效度。
是指测验能够测量到理论上的构想或特质的程度。所谓构想通常指一些抽象的、假设性的概念或特质，如智力、创造力、言语流畅性、焦虑等。这些构想往往无法直接观察，但是每个构想都有其心理上的理论基础和客观现实性，都可以通过各种可观察的材料加以确定。
确定构想效度的步骤：
建立理论框架，以解释被试在测验上的表现；
依据理论框架，推演出各种有关测验成绩的假设；
以逻辑和实证的方法来验证假设，根据这些累积材料决定这种理论是否能恰当地解释现有材料，如果不能作出恰当解释，则应该修正上述假设，直到能作出恰当的解释为止。
常见的确定构想效度的指标：
发展变化；
与其他测验的相关；
因素分析。是分析行为资料内部关系、结构特性的一种统计技术，比较适合于对构想效度的研究。通过因素分析可以找出测验中所包含的特质。
内部一致性。考验内容一致性的方法主要有三种：
考察总分较高和较低两类人在各题目上通过率的大小，比较每个题目上总分最高的27%的被试与总分最低的27%的被试，如果通过率显著大于后者，则认为题目是有效的，否则应淘汰或修改。
计算题目与总分的相关，如未达显著水准，应予淘汰。
求分测验与总分的相关。
会聚效度和区分效度。1960年坎贝尔指出要确定一个测验的构想效度，则该测验不仅应与测量相同特质或构想等理论上有关的变量有高的相关，也应与测量不同特质或构想等理论上不同的变量有低的相关，前者称为会聚效度，后者称为区分效度。
人事测量的关键技术：项目分析
填空及选择
⒈难度分析就是对题目的难度进行估计以确定适宜的难度。
⒉题目难度水平究竟多高合适，依赖于测验的目的、性质和题目形式。
⒊对于是非题而言，其难度值应该为0.75最为合适；而对于四择一题目，其难度约为0.63时最为合适。
⒋就成就测验而言，一般要求项目和总分的相关达到0.2以上，而鉴别度指数希望达到0.15-0.20以上。一般心理测验，D值在0.30以上就可以接受。
名词解释
⒈项目鉴别度是指测验项目对于所测查的心理特性的鉴别能力和区分程度。鉴别度分析可以从项目效度和内部一致性两方面着手。
⒉鉴别度分析的指标有相关系数和鉴别度指数两种。
⒊衡量项目鉴别度的简便方法，即鉴别度指数，它是比较效标得分高和得分低的两组被试在项目上通过率上的差值：D=PH-PL
当效标成绩是连续变量时，可从分数分布的两端各选择27%的被试组成高、低分组，再分别计算两组每道题目上各自的通过率，二者之差就是各题目的鉴别度指数D。
⒋有时在进行项目分析时，难以找到合适的效标，这时可以采用测验的总分代替效标，考察每个试题和总分的一致性，即做项目――总分分析。这种分析反映的是测验各项目所测查内容的一致性，而不能反映题目对效标的有效性。
⒌诱答分析是指系统考察测试题目，以诊断题目是否符合一系列测量学要求的过程，主要目的在于避免猜测的影响，使题目真正反映应试者的真实情况。
⒍在设计诱答时，要注意避免两种情况：⑴不要出现过于容易被排除的诱答，这会使不知道正确答案的被试猜测正确的概率提高；⑵不要出现过于似真的选项，即欺骗性诱答。
如果被试掌握了题目所要考察的全部知识仍很难对正确答案与某一诱答进行区分，那么该诱答就是欺骗性诱答。欺骗性诱答的出现使题目实际考察了目标之外的能力，使测验的效度降低。
⒎教育敏感性是指一种教育培训项目能否产生特定效果的可能性程度。选取两组被试（人数相同），一组进行培训，另一组不参加培训。培训结束后，对两组被试施测待分析的测验。计算每个题目的“教育敏感性”指数：s=（RH-RL）/N
 简答及论述
⒈论述项目效度与内部一致性的比较。
⑴项目效度分析主要以效标为依据，考察被试在每个试题上的反应与其在效标上表现的相关程度，即每个试题所测查的行为是否反映了被试在效标上的表现。
内部一致性信度系数主要反映的是测验内部题目之间的关系，考察测验的各个题目是否测量了相同的内容或特质。
⑵项目效度代表题目与外在效标的关系，内部一致性则更多地代表题目与总分的关系。有较高的内部一致性的题目，并不一定与外在效标有很高相关。同样，部分具有很高项目效度的题目，与测验总分的相关并不理想。项目效度和内部一致性有时候是有矛盾的。
⑶如果测验是预测性测验，则应该多采用项目效度较高的试题；如果测验要求同质，即希望各个试题都测量同一特质，则应该选择内部一致性较高的题目。有时这两种方法也结合使用。
人事测量在现实中的应用
填空及选择
⒈人事测量的主要用途：选拔、培训、考核和晋升。
⒉人事测量简化流程：⑴诊断岗位素质需要，制订人－事对应表；⑵确定测评方法、工具；⑶实施测评；⑷鉴定测评效果。
⒊企业人才测评的技术组合形式：⑴针对人事业务目的的组合；⑵针对岗位与职务的组合；⑶针对企业文化的组合。
名词解释
⒈人力资源是指人所具备的能按一定要求（质、量、速度、耐用性）完成一定工作的各种躯体的和心理的素质或准备，包括个体的能力、技能、个性、动机模式、兴趣偏好、价值取向、交际风格及知识等，以及由个体的人构成工作团队乃至整个组织时所产生的整体特性和效力。
⒉综合评价是以岗位对人事的各方面要求为依据，也就是说，是以人－事匹配为原则，进行全面系统的评价。
⒊社会中有许多工作岗位，每一个工作岗位都对任职者的素质有各方面的要求。只有当任职者具备所有这些要求的素质，并达到规定的水平，才能最好地胜任这项工作，获得最大绩效。这种人和岗位的对应关系就是人－事匹配关系。
⒋能力性向就是指一个人的能力结构各方面的组合特征，它使其具有特定的才干、胜任特定的工作。
⒌划销测验即在规定时间里按要求以一定规律划销测验纸上指定的内容，分析不同时间、不同任务要求下作业的成绩（作业量和正确率），以此判定气质特征。
内田－克里佩林测验是一项很简单但很有效用的气质测量工具。
⒍在现实工作中，我们会经常遇到具体的工作能力上的素质，它们本身并不是某种单纯性的素质，而是由多种素质综合而成，故称为综合素质。它们在现实工作中很难被分解，它们只是对应于具体的工作要求，而不是一种理论上的单一素质。
如高层管理者常常需要具备一些综合管理能力，包括计划、组织、预测、决策、沟通等。此外，他们还需要对多方面管理业务的整体运作能力，包括对人、财、物、信息等多方面控制、把握。由于这些素质具有复杂的构造成分，使相应的测量、评价有很大的难度。
简答及论述
⒈组织为什么要进行人事测量？
如果把人当做一种资源，一种资本，一种需要并且能够增值的资本，那么你就会理解为什么要运用人事测量。人力资源作为一种资本也可以运作，你就需要对它有所了解。许多发达工业国家的大企业，都会在不同程序上以一定的方式采用各种类型的人事测量工具，对人力资源进行评价。逻辑原因如下：
⑴企业经营目标是由人来实现的；
⑵为了实现一定的企业经营目标，需要一定的人力资源；
⑶什么样的人力资源能胜任企业目标，需要进行评估。
⒉关键事件法的步骤。
关键事件法是指通过要求任职者回忆过去工作中的一些重大事件、评价正确应付、处理该事件的行为、方法即由此对当事人素质的要求，从而建立岗位素质要求说明的方法。一般有以下几个步骤：
⑴回忆关键事件；⑵界定关键行为和方法；⑶说明采取关键行为和方法所要求的素质；⑷对各种素质内容分配权重。
⒊实施测评的三大要素。
为保证测量数据的可靠性、正确性，必须注意实施过程中的一些因素，具体如下：
⑴现场环境设置：温度、湿度、整洁度、照明、噪音、工作相关性等；
⑵主试态度：温和、支持性、倾向性；
⑶过程控制：标准化。
实施过程有三大要素：现场的物理环境、主试主观态度构成的心理环境、过程的标准化所构成的技术环境。
⒋如何对人事测量进行管理。
对人事测量管理，简单地说，必须严肃、慎重地对待人事测量，不可滥用人事测量，还要对人事测量的结果采取必要的安全措施。
⑴目的管理。
要进行人事测量，首先必须澄清目的，如果目的不清，还会使人事测量面临一系列后果：①无法确定要测量的具体内容；②无法确定要测量的合适对象；③无法确定适宜的测量工具；④无法确定测量结果的评价标准；⑤无法合理、有效利用测量的结果，造成浪费。
⑵技术管理。
从事人力资源管理工作的专职人员应当熟悉人事测量的基本原理、方法。
⑶现场管理。
人事测量是极其严肃的事，必须认真对待。现场环境的布置、预先的通知、协调，测验材料的印刷，答题工具的准备，指导语的形式等。所有这些要素、环节都细心安排，不能疏忽，否则就会引起测量结果的误差，使结果难以解释。
⑷安全管理。
保密性问题涉及两个方面。一是测量工具本身必须保密，不能外传、流失，否则可能使测量失效。另一方面，保密性涉及为被测量者保守个人隐私。
⑸应用管理。
人事测量的结果为人事招聘、选拔、安置提供依据。
⒌论述测评的使用价值。
假定某企业现在要招聘一批人，企业预先设定好了选人的标准。假设应聘人群有40%达标，但事先并不知道谁是达标者。那么，如果要从中选出20%的人，靠随机的方法把握只有8%。但如果有一个哪怕只有0.50效度系数的测验，那么把握就可达到69%，如果靠0.70效度系数的测验，把握可达82%，已经是相当理想了。

 合乎标准的人错误拒绝 正确接受
 B A
工作绩效标准
 D C
不合标准的人正确拒绝 错误接受

 测量标准
 拒绝 接受
椭圆的形状实际上反映了测量结果与真实结果之间的拟合关系，即效度。效度越大，椭圆越扁，越接近斜线，犯B类和C类错误的可能性越小，测量越准确，决策越可靠。需要注意的是，测量标准设定的最佳点是经过椭圆的中心，这时选择正确比率最大。但由于一般来说，我们更关心A的比率尽可能大、C的比率尽可能小，那么，即使效度不很高的情况下，提高测量标准，也可达到提高A的比率、降低C的比率的作用。
基本测验：个性品质测验
简答及论述
⒈卡特尔16种人格因素测验。
⑴人格测验目的与功能。
目的：利用成熟的人格测验方法对管理者或应聘人员的人格类型进行诊断，可为人事安置、调整和合理利用人力资源提供建议。这正是本测验的使用目的所在。
功能：从乐群性、敏锐性、稳定性、影响性、活泼性、规范性、交际性、情感性、怀疑性、想象性、隐秘性、自虑性、变革性、独立性、自律性、紧张性16个相对独立的人格对人进行描绘，并可以了解应试者的环境适应、专业成就和心理健康等方面的表现。
⑵测验的特点：卡特尔16种人格特质测验是自陈量表，对自我进行判断。
⑶适用对象：本测验是评估16岁以上个体人格特征的最普遍使用的工具之一，广泛适用于各类人员，对被试的职业、级别、年龄、性别、文化等方面均无限制。
⑷构成：测验由187道题组成，共有16个分量表。
⑸本测验需要特别注意的事项：
使应试者真实做答；
注意甄别应试者的反应风格，即答题倾向性。对分值描述，是否有答题倾向性，要排除；
注意考察应试者是否有社会赞许性倾向，特别在用于对应聘者的筛选测验中；
如果需要，在本测验中可加入测谎量表，作为监控手段。
⒉DISC个性测验。
⑴测验目的与功能。
目的：DISC个性测验就是一种人格测验，它包括24组描述个性特质的形容词，应试者要根据自己的第一感觉，从每组四个形容词中先出最适合自己和最不适合自己的形容词。
功能：DISC个性测验着重从四个与管理绩效有关的人格特质对人进行描绘，即支配性(D)、影响性(I)、稳定性(S)和服从性(C)，从而了解应试者的管理、领导素质以及情绪稳定性等。
⑵测验的特点：①适合一般、正常的个体；②与管理绩效相关，能很好地描述应试者的个性特征，并能预测其领导特征和情绪稳定性等；③测验时间短，简单易行；④有比较完善的解释体系。
⑶适用对象：大、中学生。大、中学生往往面临升学、就业的选择。
社会上的一般人员。成年人往往对自己的性格特点也不是十分地了解，知道自己性格上的优势、缺点有助于更好地进行工作；
管理人员。选择一些更易与企业形象、企业文化相融合个体，形成企业独特的特征和氛围。
⑷测验的构成：DISC个性测验由24组描述个性特征的形容词构成，每组包含四个形容词，这些形容词是根据支配性(D)、影响性(I)、稳定性(S)和服从性(C)四个测量维度以及一些干扰维度来选择的，要求被试从中选择一个最适合自己和最不适合自己的形容词。
⒊论述：比较以下几种人格测验：MMPI、16PF和DISC。
⑴人格主要是指人所具有的与他人相区别的独特而稳定的思维方式和行为风格。人格同人的工作绩效和工作方式及习惯有关。
⑵明尼苏达多相人格问卷(MMPI)。
建立初衷是要诊断各种类型的精神病和心理疾患。各类患者与正常人区分开来的题目，组合成相应的测验。它对于区分正常人与病人比较灵敏，但并不合适对正常人进行不同目的检测，故而在组织人事选拔中并不常用，也不适合用。
⑶卡特尔16人格因素问卷。
引入统计分析的方面，经过大量计算，发现可用16个因素维量描述所有人的人格面貌，从而建立了16人格因素问卷。16人格因素测验是以正常人为对象，描述各种人在16个人格因素维量上的表现形态，从而描述人的人格结构。相对较多地应用于工商界，不过由于它只是针对普通人建立的人格测验，它基本上适合普通从业者，并不适合中高层管理者。 
⑷DISC人格测验
是一个相当流行的简便易行的人格测验。它把人格分为四大类型，即支配型、交际型、稳妥型、服从型，对每种类型的人又区分出6种亚型。由于它能作出详细的分类，同时又能对每种人的特征、团队价值、所适宜的工作环境等给出较详细的说明，在工商界受到相当欢迎。
⒋管理人员人格测验。
⑴测验的特点：该人格测验是根据“大五”人格模型中五大人格维度（正性情绪倾向、负性情绪倾向、乐群性、责任心、广纳性）及经大量研究证明与管理绩效有关的7项人格维度（内控性、自控性、自信心、A型人格、成就动机、权力动机、面子倾向）构建成的一项个性测验。测验题目以三择一的选择题形式出现。
⑵测验的构成：12个人格维度，分别是正性情绪倾向、负性情绪倾向、乐群性、责任心、广纳性、内控性、自控性、自信心、A型人格、成就动机、权力动机、面子倾向。
基本测验：职业适应性测验
 填空及选择
⒈生活特性问卷是为评定个体的动机水平而编制的。
维度定义： ⑴风险动机；⑵权力动机；⑶亲和动机；⑷成就动机。
⒉需求测试的特点：本测验的设计和建构参照了马斯洛的需要层次理论所提出的五种层次的需求形式，以生理需求、安全需求、爱的需求、自尊的需求、自我实现的需求为维度建构而成。其中生理、安全需要、爱与归属的需要为较低层次的需求，主要靠外在事物来满足；而自尊的需要、自我实现的需要为高层次需求，是自己内在的满足。
⒊职业兴趣测验的特点：霍兰德在研究职业兴趣的共同性和差异性之中找到的六个测查维度：*作取向、研究取向、艺术取向、社交取向、经营取向、事务取向。其理论来源主要基于下面的几个假设：
⑴大部分的人可被归于六种人格类型的一种；
⑵现实社会中存在六种不同的工作环境；
⑶人们倾向于寻找和选择那种有利于他们技术、能力的发挥、能充分表达他们的态度、实现他们的价值、并使自己能扮演满意角色的环境；
⑷一个人的行为是他本人个性和环境特征相互作用的结果；
⑸个体类型和环境类型的一致性、和谐度的程度可由一个六角形模型来解释和评估；
⑹个体内部或环境内部自己的相容性程度也可用一个六角形模型来决定。
⑺个体或者环境的区分度可由职业的编码、所绘的结果剖面图以及两者共同来解释。
名词解释
职业适应性测验主要从个体的需求、动机、兴趣等方面考察人与岗位工作之间的匹配关系。这一类测验了解个体的生活目的、追求或愿望，反映个体对工作的期望，因此对于选拔人员、激励设计等方面很有参考价值。
基本测验：能力测验
简答及论述
⒈多项能力与职业意向咨询。
⑴测验的功能：多项能力与职业意向咨询选取了和社会上大多数职业活动有着密切关系的六个维度进行测评，即语言理解和组织能力、概念类比能力、数学能力、抽象推理能力、空间推理能力、机械推理能力。
⑵测验的特点：能力倾向测验一般指用来测量从事某种职业或活动的潜在能力的评估工具。能力倾向不是特殊训练的结果，它存在于某种特定的训练与学习之前。可以把能力倾向测验分为三类：一般能力倾向测验、特殊能力倾向测验和多因素能力倾向测验。
一般能力和特殊能力。一般能力指通常所说的记忆力、注意力、想象力等，也是人们常说的“智力”。特殊能力指音乐能力、绘画能力等。
⒉数量分析能力测验的功能。
在测验的测查不需要任何特别的专业知识背景，测查内容和范围包括：
⑴对数值、图表的敏感性；
⑵快速的综合分析能力；
⑶一定的快速数字估算能力。
⒊敏感性与沟通能力测验。
⑴测验的特点及维度。
本测验分两部分：敏感性测验与沟通能力测验。敏感性测验测查应试者对人际事物的洞察、分析和预见能力，特别是在认识和把握问题的实质并进行分析处理时敏锐地捕捉人际信息、利用人际关系有效地解决问题的能力；沟通能力测验侧重于对应试者在营销情境中运用人际沟通技巧和策略方面的考察。
⑵测验有以下维度：①敏感性；②沟通行为倾向：开放式沟通倾向、*纵式沟通倾向、非沟通倾向（营销意识）；③营销意识。
基本组织人事调查
填空及选择
⒈调查和测验不同，目的主要是了解某种特征或态度或行为倾向的普遍性或程度或影响性。
⒉个体行为评估：⑴工作感觉评定目的：测查员工对现任工作的满意度，为组织了解员工的工作态度，预测其工作效率和稳定性提供信息。
特点：直接询问员工感受的问卷调查法是最为有效的测量工具。
⑵价值取向评估目的：测查员工在社会、理论、唯美和经济－政治四种价值取向的相对强度。可由此鉴别职业生活志向，评定工作动机。
⒊领导行为评估：沟通方式评定、冲突应付方式评定、工作习惯评定和变革意识评估。
⒋工作习惯评定目的：测查管理者的官僚倾向，是否能接受或偏好严格的制度和规范化模式。
⒌团体行为评估：团队健康度测试和团体绩效评定。
基于情境的测验
填空及选择
⒈管理者的管理能力主要来自三个方面：自身素质基础、社会实践体验、所掌握的有关知识。
⒉公文筐测验实施的五个维度：工作条理性、计划能力、预测能力、决策能力、沟通能力。
⒊公文筐测验从以下两个角度对管理人员进行测查，一为技能角度，主要考察管理者的计划、预测、决策和沟通能力。一为业务角度，公文筐的材料涉及财务、人事、行政、市场等多方面业务。
⒋在评价中心技术中，用于评估和选拔管理人员的情境模拟测试有两种：⑴小组作业；⑵个人作业。
⒌讨论题的形式：⑴开放式问题；⑵两难问题；⑶多项选择问题；⑷*作性问题；⑸资源争夺问题。
⒍无领导小组讨论的维度定义：⑴组织行为；⑵洞察力，又称智慧能力；⑶倾听；⑷说服力；⑸感染力；⑹团队意识；⑺成熟度。
⒎结构化面试的特点：⑴科学性；⑵双向沟通性。
名词解释
⒈公文筐测验，又叫文件筐测验，是为中、高层管理人员的选拔、考核、培训设计的一项具有较高信度和效度的测评手段，为企业的高层人力资源计划和组织设计提供了科学可靠的信息。也可用于其它行业，如企事业单位的中、高层管理人员。
公文筐测验是一种情境模拟测验，是对实际工作中管理人员掌握和分析资料、处理各种信息以及作出决策的工作活动的一种抽象和集中。测验在假定情境下实施。
⒉无领导小组讨论是指由一组应试者组成一个临时工作小组，讨论给定的问题，并作出决策。由于这个小组是临时拼凑的，并不指定谁是负责人，目的就在于考察应聘者的表现，尤其是看谁会从中脱颖而出，成为自发的领导者。
简答及论述
⒈什么是测查管理能力的最有效方法？
⑴测查管理能力的最有效方法是评价中心技术，在选用管理人员时，评价其是否具备较好的管理能力。有研究表明，评价中心技术的预测效度在现有各种方法中是最高的。而公文筐测验是评价中心技术的主要工具之一。
⑵评价中心方法是把受评人置于一系列模拟的工作情境中，由企业内部的高级管理人员和外部的心理学家组成评价小组，采用多种评价手段，观察和评价受评人在这些模拟工作活动中的心理与行为，以考察受评人的各项能力或预测其潜能，了解受评者是否胜任某项拟委任的工作以及工作成就的前景，了解其欠缺之处，以确定重点培训的内容和方法。
⑶评价中心技术的主要评价手段包括：诊断性面谈、投射测验、纸笔测验、小组问题解决、无领导小组讨论、角色扮演法以及公文筐测验。
⒉如何看待结构化面试的结构性？
⑴面试考核要素结构化，并作为评分标准的基础。
⑵面试试题（内容、种类、编制）的结构化，不同类型的题目与测评要素相对应。
⑶评分标准结构化（要素得分、所占比重、总分、考官评语、与其他测评工具的得分的合成，有一定比率）。
考官使用的评分工具包括个人评分表和得分平衡评分表。评分内容：测评指标、水平刻度、测评规划。
⑷组建面试考官、监督员及考务人员队伍结构化。面试小组由5-9人组成，设有主考官、副主考官、监督员及考务人员等。
⑸选择与布置考场结构化。
⑹具体*作步骤结构化。
⒊结构化面试实施应具备的基本功能。
⑴区分功能：在一定程度上能够区分出应试者相对差异，依据量化结果可做参照和比较；
⑵评定功能：是否达到了规定的某标准；
⑶预测功能：预测应试者在未来岗位上的表现、成功的可能性和成就。
⒋结构化面试方案的构成。
本面试方案共由五部分材料构成，分别为《人员甄选中面试的技术规范》、《面试考核要素重要性及具体标准分析表》、《规范性问题设计》、《个人评分表》、《得分平衡表》。
面向高绩效管理的测验
填空及选择
⒈“面向高绩效管理的测验”共包括10 项工具。⑴人际敏感能力测验；⑵管理变革测验；⑶团队指导技能测验；⑷自我实现测验；⑸人际关系管理测验；⑹沟通技能测验；⑺XYZ管理方式测验；⑻基本管理风格测验；⑼管理情境技巧测验；⑽组织绩效测验。
⒉基本管理风格测验把管理行为在两个维量上展开分析：工作取向和关系取向。
 高关系低工作高关系高工作
关关系式 关系式
系
取 低关系低工作高工作低关系
向分离式 治业式
 工作取向
简答及论述
⒈XYZ管理方式测验.
⑴X假定。认为人类基本上是动物性的，是一种被文明所控制的动物，它生来是邪恶的，是由生物冲动所驱使的，是为了追求金钱和物质满足而生存的，它的基本交往模式是竞争。典型的表现是认为：
人类喜欢竞争；
提高绩效的唯一办法是提高报酬；
政府的基本职能是控制、约束。
⑵Y假定。认为人类的本性基本上是寻求自我实现，他们不需要什么控制、约束而能卓越地工作，人的本性是善的，是由人性所驱使的，它的基本交往模式是合作。这一假定的典型表现是认为：
人喜欢与别人合作；
绝大多数人是相互信任；
政府的真正职能是帮助社会。
⑶Z假定。认为人类的本性基本上是理性的，它寻求理性并由理性所约束。人生来既不是善的，也不是恶的，而是可能在后天影响下成为善的或恶的。人是由智慧所驱使的，它的基本交往模式是独立。典型表现是认为：
理解人的最佳方式是把人看做是理性的；
人是按照他们认为应该做的事去行为的；
让人从事某种工作的最佳方法是清楚地说明工作的内容、方法、意义等所有方面。
人事测量工具的组合原理
填空及选择
任何一个完善的人事测量系统，应该具备两种功能：⑴提供足够数量的、满足实用选择的工具。这是人事测量系统的基本功能，那种靠少数几种工具“不变应万变”的做法是不可取的；⑵提供如何组合各种测量工具的技术。这是人事测量系统的高级功能。
简答及论述
⒈测量工具的组合设计一般程序。
测量工具的组合设计一般包括七个步骤：确定考评目的、需求分析、确定测量手段、预期结构、实施过程的设计、考评时间、费用预算或报价。
⑴确定考评目的。
确立考评目的是人事测量的开端。从大处讲要参考社会、市场、经济形势的发展状况，结合企业的长远发展战略、企业的文化追求。如日本的TOTO有追求卓越的理念，在招聘时希望自己的员工有精益求精的品质。从小处讲，考评目的的确立要结合企业的经营策划、组织策划、变革策划。要结合具体的人事管理目的和人力资源开发需要。
⑵需求分析。
需求分析建立在对施行人事测量的企业有全面、深入的认识基础上。如要了解公司的规模、性质、管理体制、经营理念、企业文化等方面的情况。
要求人员素质的考评要素必须反映：①企业文化和理念的要求；②岗位工作的要求；③岗位职责的要求；④个人可发展性的要求；⑤适应性要求。
从内容上看，考评要素包括：①个性品质；②职业适应性（如兴趣取向、价值取向、需求与动机水平）；③技能与能力：资格认证水平（如专业技能水平，外语、计算机应用水平等）、基本能力（如智力水平）、职业能力（如营销技能）、管理技能（如计划、预测、决策、沟通能力）。
⑶确定测量手段。
在每选择一个具体的工具时，要说明这个测量工具的功能，采用的理由。在选择测量工具时，必须考虑到企业的特色与文化。
⑷预期结果。
预期包括几个方面的内容：①由具体的分数如何建立综合报告；②测量的结果将如何指导后期的工作；③可能在更大范围中对员工产生的影响；
⑸实施过程的设计。
把实施所有测量的具体程序确定下来，包括说明有关时间、地点、辅助材料、现场布置要求、分组（如果需要的话）、设备、流程等所有细节工作的安排、落实。各个测量之间要有充分的休息。
⑹考评时间。
测量组合设计时要考虑和说明测量项目的时间。
⑺费用预算或报价。
在完成一个人事测量的设计时，要给出它的预算（对组织内部而言）或报价（就组织外部而言）。
以上七步骤的设计落实在文字上，就构成了人事测量计划书，可用于项目申请、服务业务洽谈等。
⒉实施过程的设计应考虑的原则。
⑴简便易行的测量放在前面（但有时为了充分利用上、下午的时间，也会按时间段的长短调整顺序）。
⑵成本低的测量放在前面。
⑶当一个测量的内容可能影响（如暗示、帮助）其他测量时，这个测量应放在后面。
⑷容易产生疲劳的测量放在后面。
⑸测量内容比较敏感，或容易造成较大压力的测验（如能力测验）应放在后面。
⒊论证技巧。
在构思和计划书的写作中应注意以下几点：
⑴要紧扣目的；
⑵要有逻辑性，体现合理性；
⑶结合企业的经营理念、文化追求来论证，体现“量体裁衣”的设计品位；
⑷充分肯定企业／客户需求的重要性、迫切性和正当性，在认识上体现共识。
⒋组合的原则。
⑴以满足企业／客户的需求为目的，充分体现对该需求的呼应；
⑵以工作分析为基础，突出重点，全面考评；
⑶以对企业或职位来说十分关键的素质作为评估重点，考虑经济原则；
⑷以能力、个性评估、职业适应性（动机、需求、兴趣）三大模块为基本测评内容。
针对不同管理目的的人事测量
填空及选择
⒈培训与开发是人力资源管理的基本核心。
⒉培训与开发的需求分析包括三个方面：组织的需求分析、工作任务的需求分析和人员的需求分析。
⒊基层主管人员的晋升选拨：重要品质：管理意识、智力、分析能力、信息沟通能力和正直。
⒋人事考核的概念从内涵上说是对人或事的评价，有两层含义：⑴对人及其工作现状进行评价；⑵对人的工作结果，即人在组织中的相对价值或贡献程度进行评价。
⒌用于考核的心理测验设计原则：多项能力测验、管理数量分析能力测验、管理逻辑推理能力测验、公文筐测验、小组讨论和面向高绩效的管理潜能开发测验。
⒍用于激励的测验常用的工具包括：动机测验、价值取向测验、需求模式调查、工作满意度调查和激励因素调查。
简答及论述
⒈一个有效的甄选录用程序必须符合的特征。
⑴甄选录用程序是标准化的，每位通过同一岗位甄选系统的应聘者都经历同样数量和类型的选拨程序。
⑵甄选录用系统以有效的顺序排列各种程序。花费较多的程序要作为系统的最后程序，只用于那些最可能被录用的求职人员。
⑶甄选录用系统能提供明确的、客观可靠的决策点。关于求职者通过这些决策所具备的资格以及他们能否在评价系统中继续走下去，管理者有着共同的标准。
⑷甄选录用系统能保证充分容纳确定求职者是否胜任工作所必需的信息。
⑸甄选录用系统可防止在了解求职者背景情况时出现预料之外的重复。
⑹甄选录用系统能更突出求职者背景情况中的最重要的方面。
⒉用于人员选拨的测验组织原则。
对人员选拨有两种策略：一是择优策略，指尽可能全面地了解所有应聘人员的情况，从能力、性格、动机、兴趣等各个角度和层次上做广泛测查，依据职位要求综合性地评估个人的优势水平、与职位要求的匹配程度，从中选择综合优势最好的人员。另一是劣汰策略，指依据职位的要求定出从业人员所必须具备的能力的基线水平，通过能力测验筛除掉能力达不到基本要求的人员。那些通过劣汰测验的人员，并非都能胜任职位的要求。
采用择优策略，在测验设计上往往要求全面、详细，能力测验、个性测验和职业适应性测验都要使用，并且对应不同的职位要考察的内容侧重点不同，从而各测验维量的权重关系不同。
采用劣汰策略，在测验设计上要求准确、适度，往往以能力测验或专业知识和职业技能考试为主。
⒊人事测量工具应用程序是如何进行*作的？
人事测量工具具有客观性，有诊断和预测两大功能，利用测评技术建立晋升考评体系是可行的。应用程序如下：
⑴按岗位进行深入的工作分析，比较原有职位要求与晋升职位要求的差别，包括所需的知识、技能和经验的规定性，依据这些差别确定具体的考察内容，设定量化的晋升标准。
⑵针对考查内容选取与之相关、敏感、可靠的预测因子（如个性、能力、兴趣等），将能够测量出个体在这些因子上的水平的测量工具作为考评手段，并构成组织设计。
⑶实施考评。有条件的话，不仅要求候选人接受考评，而且对现已在他们未来的职位所属管理层的人员也参与测试。这属于基础性的工作，通过测试不仅可以对候选人排序，而且能够了解候选人与其目标层人员的差异程度，这将提供后续指导和训练的线索。
⒋人事考核的内容及关系如何？
⑴成绩考核与业绩考核。
成绩或业绩考核就是考核组织成员对组织的贡献，或者对组织成员的价值进行评价。
对于一个企业经营者来说，希望每一个员工的行为能够有助于企业经营目标的实现，为企业作贡献。这就需要对每个员工的成绩、业绩进行考核，并通过考核掌握员工对企业贡献的大小、价值的大小。
对每一个员工来说，企业至少是自己谋生的场所和手段，希望自己的成绩和业绩被考核所评价，以便自己的贡献得到企业领导的承认。
⑵能力考核。
能力考核是考核员工在职务工作中发挥出来的能力，考核员工在职务工作过程中显示出来的能力，诸如某员工在工作中的判断是否正确、迅速，协调关系如何等，依据他们在工作中表现出来的能力，参照标准或要求，确定他的能力发挥得如何等，作出评定。
针对不同对象的人事测量
填空及选择
⒈培训与开发是人力资源管理的基本核心。
⒉培训与开发的需求分析包括三个方面：组织的需求分析、工作任务的需求分析和人员的需求分析。
⒊基层主管人员的晋升选拨：重要品质：管理意识、智力、分析能力、信息沟通能力和正直。
⒋人事考核的概念从内涵上说是对人或事的评价，有两层含义：⑴对人及其工作现状进行评价；⑵对人的工作结果，即人在组织中的相对价值或贡献程度进行评价。
⒌用于考核的心理测验设计原则：多项能力测验、管理数量分析能力测验、管理逻辑推理能力测验、公文筐测验、小组讨论和面向高绩效的管理潜能开发测验。
⒍用于激励的测验常用的工具包括：动机测验、价值取向测验、需求模式调查、工作满意度调查和激励因素调查。
简答及论述
⒈一个有效的甄选录用程序必须符合的特征。
⑴甄选录用程序是标准化的，每位通过同一岗位甄选系统的应聘者都经历同样数量和类型的选拨程序。
⑵甄选录用系统以有效的顺序排列各种程序。花费较多的程序要作为系统的最后程序，只用于那些最可能被录用的求职人员。
⑶甄选录用系统能提供明确的、客观可靠的决策点。关于求职者通过这些决策所具备的资格以及他们能否在评价系统中继续走下去，管理者有着共同的标准。
⑷甄选录用系统能保证充分容纳确定求职者是否胜任工作所必需的信息。
⑸甄选录用系统可防止在了解求职者背景情况时出现预料之外的重复。
⑹甄选录用系统能更突出求职者背景情况中的最重要的方面。
⒉用于人员选拨的测验组织原则。
对人员选拨有两种策略：一是择优策略，指尽可能全面地了解所有应聘人员的情况，从能力、性格、动机、兴趣等各个角度和层次上做广泛测查，依据职位要求综合性地评估个人的优势水平、与职位要求的匹配程度，从中选择综合优势最好的人员。另一是劣汰策略，指依据职位的要求定出从业人员所必须具备的能力的基线水平，通过能力测验筛除掉能力达不到基本要求的人员。那些通过劣汰测验的人员，并非都能胜任职位的要求。
采用择优策略，在测验设计上往往要求全面、详细，能力测验、个性测验和职业适应性测验都要使用，并且对应不同的职位要考察的内容侧重点不同，从而各测验维量的权重关系不同。
采用劣汰策略，在测验设计上要求准确、适度，往往以能力测验或专业知识和职业技能考试为主。
⒊人事测量工具应用程序是如何进行*作的？
人事测量工具具有客观性，有诊断和预测两大功能，利用测评技术建立晋升考评体系是可行的。应用程序如下：
⑴按岗位进行深入的工作分析，比较原有职位要求与晋升职位要求的差别，包括所需的知识、技能和经验的规定性，依据这些差别确定具体的考察内容，设定量化的晋升标准。
⑵针对考查内容选取与之相关、敏感、可靠的预测因子（如个性、能力、兴趣等），将能够测量出个体在这些因子上的水平的测量工具作为考评手段，并构成组织设计。
⑶实施考评。有条件的话，不仅要求候选人接受考评，而且对现已在他们未来的职位所属管理层的人员也参与测试。这属于基础性的工作，通过测试不仅可以对候选人排序，而且能够了解候选人与其目标层人员的差异程度，这将提供后续指导和训练的线索。
⒋人事考核的内容及关系如何？
⑴成绩考核与业绩考核。
成绩或业绩考核就是考核组织成员对组织的贡献，或者对组织成员的价值进行评价。
对于一个企业经营者来说，希望每一个员工的行为能够有助于企业经营目标的实现，为企业作贡献。这就需要对每个员工的成绩、业绩进行考核，并通过考核掌握员工对企业贡献的大小、价值的大小。
对每一个员工来说，企业至少是自己谋生的场所和手段，希望自己的成绩和业绩被考核所评价，以便自己的贡献得到企业领导的承认。
⑵能力考核。
能力考核是考核员工在职务工作中发挥出来的能力，考核员工在职务工作过程中显示出来的能力，诸如某员工在工作中的判断是否正确、迅速，协调关系如何等，依据他们在工作中表现出来的能力，参照标准或要求，确定他的能力发挥得如何等，作出评定。
针对不同对象的人事测量
填空及选择
⒈一个组织有其不同的层次结构，包括个体层次、团体层次和整个的组织层次。针对不同层次的人事测量方案可能有所差别。
⒉个人测评的内容一般包括能力、个性特征和个性倾向类测验。
⑴能力结构诊断：依据其职业背景和兴趣，可考虑选择沟通能力测验、逻辑推理测验、公文筐测验和小组讨论。
⑵个性特征描述：通过个性测验可帮助个人全面把握个性上的突出特点、风格，正确认识个人的影响作用，调整自己在组织团队中的定位，实现个人性格与职业、与团队良好磨和。
⑶个性倾向定位。与个性一样，个人的兴趣取向、动机需求模式、价值观取向等，也影响着个人的态度、职业满意度、职业专注程度，最终影响个人潜力的发挥。
⒊应试人员可能有高社会赞许倾向，表现出假饰行为，在测验设计、实施和结果分析中要注意监控和鉴别这种倾向。具体方法：
⑴选用低表面效度的测验，比如能力测验、行为模拟；
⑵选用有可相互参照检验的维量的测验，比如职业兴趣测验和价值观取向测验配合使用，个性测验和动机需求测验配合使用；
⑶在测验指导语中加入必要的解释，消除应试者的顾虑，强调真实做答的必要性；
⑷人事测量实施者应以客观的第三方角色出现，要求应试者的重要关系人回避；
⑸在结果分析中，检查应试者的卷面做答和相关维量上的得分情况，分析应试者对同一表述或问题的反映的一致性和合理性；
⑹如有测谎分数，注意参照。
⒋有一类测量是专门用于团队的，它们一般都十分短小、简洁，而且由于是针对团队而不是一个人，作答的掩饰低，反应真实、可靠。这些工具包括：团队健康度测验、团队绩效评估和团体凝聚力测量。
⒌组织层次测量常见的调查工具有：工作满意度调查、工作价值观调查和激励因素调查。
⑴工作满意度调查是一些企业特别西方工业发达国家企业经常实施的测量。这个调查旨在了解各层面员工对工作各方面的满意度，涉及内容包括对工作本身的看法，对工作待遇的看法，对上司的看法，对同事的感受等。
⑵工作价值观调查是对员工的价值取向进行考察，具体内容涉及理论取向、唯美取向、社交取向、宗教取向、政治取向、经济取向等方面。
目的和作用：①企业组织考察工作价值取向，主要用意在于为企业文化建设获取第一手材料；②工作价值取向调查也为企业文化的策略提供参考。
⑶激励因素调查：组织必须了解究竟什么因素可能会激励员工。这个问题被转化为考察员工对什么感兴趣、需要什么、什么使他们满意和不满意。
⒍人事测量针对于一般员工的测评侧重点不仅在于能力，也在于员工的心态，比如工作满意度、员工的需求和动机。
⒎中层管理人员所肩负的责任是多元化的，既强调职务技能和经验，又必须有才能实现管理职能。总而言之，中层管理人员所需要的品质是多种多样：
有身体的（健康、精力充沛、风度）；
智力的（理解与学习能力、判断力、思维活跃、适应能力）；
精神的（干劲、坚定、乐于负责、首创精神、忠诚、机智、庄重）；
技术的（职务所特有的知识和技能）；
经验的（由工作本身产生的）。
所有这些品质可分别归为能力、个性特征、动力适应性（个性倾向性）、知识经验四大模块。
⒏高层管理者所具备的素质：一般智力水平、工商管理能力、创造性思维能力、较高的成就动机、灵活机敏但有原则、坚韧的毅力、敏感性与沟通能力及开放和变革意识。
⒐对高层管理者可考虑选择使用的测验：⑴情境模拟测验：公文筐测验和无领导小组讨论；⑵动机调查；⑶个性评估：管理人员人格测验和DISC个性测验；⑷领导行为评估系列测验；⑸管理潜能开发系列测验。
⒑企业组织的基本运作单位包括生产（创造可使用的东西或增加商品和服务效用）、营销（寻找和吸引愿意按价格购买商品和接受服务的顾客或建立分销渠道）、财务（收支、保管和运筹企业资金），以及行政人事（安排人力资源并完成各部门之间以及内外部的必要协调）。
名词解释
假饰行为：高社会赞许性。
简答及论述
⒈针对中层管理人员的人事测量工具组合。
⑴能力方面：
采用管理人员数量分析能力测验和管理人员逻辑推理测验，通过评估应试者对商务图表资料的快速分析能力、对数量关系的敏锐判断和估算能力、对语言逻辑的分析能力，可了解其思维灵活性和严密性、理解能力和判断能力。
采用无领导小组讨论这一情境模拟测验技术，综合评价其组织协调能力、领导意识、成熟度、风度、口才、思维敏锐度；还可以考察能力以外的要素，如团队合作、人际感染力、情绪控制力等，可对管理能力、行为进行有效评价和对未来绩效进行有效预测。
采用领导行为评估中的沟通方式评定、冲突应付方式评定等工具，可以了解管理者的上下沟通能力和策略。
⑵个性方面：
采用管理人员人格测验，评估应试者的个性特征、思维风格和行为特点，可预测其管理绩效。
采用16PF人格测验，在了解其性格概貌的基础上，可进一步评估其情绪稳定性、情绪控制能力和心理健康水平，还可以了解其创造性品质、适应力和事务管理能力。
采用DISC测验可提供针对应试者本人如何扬长避短，提高管理绩效的良好的建议。
⑶兴趣、动机适应性方面：
职业兴趣测验和价值取向评定都可反映个性倾向方面的一些特性，这些特性具有直接的行为指向性，因此具有动力倾向。个人动机模式调查可鲜明地描述个人的行为目的取向。
⑷知识经验方面：
一方面，从职务所需要的知识或技能出发，考察掌握知识的水平。另一方面可通过管理人员的履历了解其受教育程度、专业技术职称水平、是否获得技能等级证书、资格证书等，以及他在以往工作经历中曾担任什么职位。
⒉各岗位系列所要求的基本素质。
⑴生产岗位系列基本素质要求。
能力：时间管理（有时间概念，讲效率，严格保证生产进度）、有效的控制力、系统全面的计划能力；
个性：认真、负责、准确；
知识经验和技能：专业水平高，熟悉生产流程和相关设施，具备安全生产知识。
⑵营销岗位系列基本素质要求。
能力：良好的沟通、协商、应变能力和人际能力，适应力强，富有创造性，情绪控制能力；
个性：乐群、热情、耐心、坚韧执着，能承受挫折感，健谈；
知识经验和技能：最好有客户关系，熟悉分销渠道，具备营销常识。
⑶财务岗位系列基本素质要求。
能力：判断力、决策力，金融预测能力；
个性：细心、严谨、准确，为人谨慎、有序、负责、原则性强；
知识经验和技能：有专业资格认证、经验越丰富越好。
⑷行政人事岗位系列基本素质要求。
能力：人际沟通能力、适应能力，全面细致的分析能力；
个性：随和、热情、友善、令人信赖，细致耐心；
知识经验和技能：熟悉有关劳动法规，具有相关工作经验。
⑸技术岗位系列基本素质要求。
能力：独创性，发现和解决问题的能力，思维严密善于学习；
个性：自信、创造性、追求自我实现，专注于技术进步，最好具有研究价值取向；
知识经验和技能：技术等级认证，相应技术领域工作经验，研究开发的理论技术成果。
针对企业特征和需求的人事测量
不同行业特殊需求及相应测量工具
行业需求分析测验类型生产制造业全面严格的质量控制力创新开发能力个性测验服务产业适于服务取向的个性、兴趣人际技能个性测验人际技能测验文化产业创造性思维高超的组织策划能力综合能力思维测验管理能力测验案例分析 高新技术产业独创性学习能力科技敏感力高新技术造诣敏锐的信息把握和驾驭能力思维测验情境模拟测验案例分析人事测量

人事测量概论

填空及选择
⒈常模是否可靠，关键是有没有一个具有代表性的被试样本。
⒉根据不同的测量目的确定具体的测量内容是人事测量的第一步。测量内容应根据所选拔岗位的任职素质要求，通常可以工作分析、职务说明为依据。
名词解释
⒈心理测量是通过科学、客观、标准的测量手段对人的特定素质进行测量、分析、评价。所谓素质，是指那些完成特定工作或活动所需要或与之相关的感知、技能、能力、气质、性格、兴趣、动机等个人特征，它是以一定的质量和速度完成工作或活动的必要基础。
⒉人事测量是心理测量技术在人事管理领域的应用，它以心理测量为基础，针对特定的人事管理目的如招聘、安置、考核、晋升、培训等，对人的素质进行多方面系统评价，从而为人事管理、开发提供参考依据。相对来说，人事测量是一个更广泛的实用概念，它通常要求运用多种心理测量工具来完成。
⒊心理测验是心理测量的一种具体方法和手段，它是结合心理学和统计学方法评价特定个体在特定素质上相对于特定群体所处的水平的手段。心理测验是人事测量中最常采用的方法之一。
⒋常模是一组具有代表性的被试样本的测验成绩的分布结构，包括它的集中趋势和离散度。常模是用以比较不同被测者测验分数的标准，它能够说明某一测验结果分数相对于同类被测者所处的水平。
⒌天花板效应：测验题目过于容易，致使大部分个体得分普遍较高的现象。
⒍地板效应：测验题目过难，大部分个体得分普遍较差的现象。
⒎信度是指测验结果的可靠性、稳定性，即测验结果是否反映了被测者的稳定的、一贯性的真实特征。
可靠性体现在：⑴测验结果跨时间的一致性――被测者在不同时间所测结果一致；
⑵测验内容的一致性――同一测验内的各部分题目所测的是同一种行为或行为特征；
⑶不同评分者之间的一致性――不同评分者对同一测验结果的评分一致。
⒏效度是指所测量到的结果是否反映了所想要考察的内容，也就是说，该测验所测的是不是它想要测的东西。
效度指标主要包括效标关联效度、内容效度和构想效度。
⒐测量的形式和工具根据测量内容的不同而不同。如，需要对应聘营销人员的口头表达、情绪控制等方面进行测查，就不宜采用一般的纸笔测验，而最好采用情境模拟测验，如小组讨论测验。但考虑一般自陈量表（即基于自我评价的问卷）的动机测验题目表面效度（即从题目表面是否容易看出出题人的意向和答案倾向）过高，或应聘者容易表现出较高的社会赞许性，即题目本身的答案反映了一般社会价值倾向，应答者很容易表现出反应偏差，投其所好，故可能不适合于在招聘考核中采用时，就可采用隐蔽性比较高的投射测验来对应试者的动机进行评定。
投射测验是人格测量的工具，考察人格个性特征，通过迂回曲折的方式投射出的个性动机、兴趣等方面。
简答及论述
⒈简述心理测量和人事测量的关系。
⑴心理测量是通过科学、客观、标准的测量手段对人的特定素质进行测量、分析、评价。所谓素质，是指那些完成特定工作或活动所需要或与之相关的感知、技能、能力、气质、性格、兴趣、动机等个人特征，它是以一定的质量和速度完成工作或活动的必要基础。
⑵人事测量是心理测量技术在人事管理领域的应用，它以心理测量为基础，针对特定的人事管理目的如招聘、安置、考核、晋升、培训等，对人的素质进行多方面系统评价，从而为人事管理、开发提供参考依据。相对来说，人事测量是一个更广泛的实用概念，它通常要求运用多种心理测量工具来完成。
⑶心理测量是人事测量的基础。人事测量是以人为对象，是对人的测量，这正是以心理测量为基础进行的。绝大多数人决策都需要以人事测量为基础。如招聘人员时，要测量应聘者的能力、工作动机；考虑晋升时要评价能力是否胜任新的职位；计划培训时要考察对象在哪些方面对于完成规定的工作任务有不足。所有这一切都要运用心理测量。故要从事人事测量，首先要掌握心理测量。
⒉心理测验的五个基本要素。
⑴行为样本。
对个体行为或行为特征的测查无法做到对所有情况面面俱到。在进行心理测量时，往往只能对经过科学选择的少数行为样本进行测查，借以推测个体的心理特征。如要考察个体的数学运算能力，可以选择一定数量有代表性的运算题进行测量。个体对所抽选出来的问题的解决行为就是行为样本。
⑵标准化。
是指测验编制、实施、记分和测验分数解释必须遵循严格的统一的科学程序，保证对所有被测者来说施测的内容、条件、记分过程、解释系统都相同。只有这样才能保证测验的客观性和准确性。
⑶难度的客观测量。
测验题目的难度水平影响到测验的客观性。测验的题目太容易，所有人都成功地完成所有项目，得分都很高，或测验题目太难，使得大部分人的得分很低，都会使所有被测者的反应趋于一致，抹消了个体差异，无法就某一素质将不同的被测者很好地区别开来，致使测验的目的无法达到。
⑷信度。
信度是指测验结果的可靠性、稳定性，即测验结果是否反映了被测者的稳定的、一贯性的真实特征。这种可靠性体现在：
测验结果跨时间的一致性――被测者在不同时间所测结果一致；
测验内容的一致性――同一测验内的各部分题目所测的是同一种行为或行为特征；
不同评分者之间的一致性――不同评分者对同一测验结果的评分一致。
⑸效度。
效度是指所测量到的结果是否反映了所想要考察的内容，也就是说，该测验所测的是不是它想要测的东西。
效度指标主要包括效标关联效度、内容效度和构想效度等。
⒊人事测量的功能与用途。
人事测量的具体功能涉及甄选、安置、考核与培训等几个方面。
⑴甄选。
在人事管理领域，人事测量可以用来对人才进行选拔。人事甄选的一个关键技术问题，是如何预测未来工作的绩效。人事测量恰恰可以为预测应聘者将来的工作行为和绩效提供重要的科学依据。
⑵安置。
通过人事测量，可以对个体的兴趣、人格、能力、技能等多方面进行分析，为实现人才的合理安置提供信息。
⑶考核与培训。
人事测量能够提供关于个体的行为的描述，形成对被测者的全面的评价，从而为人事考核及培训提供依据。
⒋简述人事测量的程序。
确定测量目的
（根据岗位职务任职要求确定检测内容）
↓
确定测量方法
（确定测量的基本形式和测量工具）
↓
实施测量
（测量的实施与数据采集）
↓
分析测量结果
（对采集数据进行统计分析并作出报告）
↓
人事决策与建议
（根据分析作出决策或对决策的建议）
↓
根据不同的测量目的确定具体的测量内容是人事测量的第一步。测量内容应根据所选拔岗位的任职素质要求，通常可以工作分析、职务说明为依据，针对不同职务、不同岗位、不同企业特征及某些特殊需要来确定。
对于以选拔为目的人事测量，另有一个重要的程序是确定选拔的标准，即确定什么样的应试者可以被企业录用。分两步进行。首先，在确定测量内容的同时确定大致标准，如选用外向者，职业兴趣为经营取向者等；其次，制定精细的标准。它可以是一个绝对的标准（如某一个分数线），通常这种情况是企业采取“淘劣”策略，即达不到这一基本标准的人决不录用。它也可以是在测量结果出来后，根据组织所需人数或筛选比例确定具体细致的标准，如某项技能分数百分位达到90%以上录用等。
⒌人事测量的基本程序。
⑴确定测量的目的和内容。
根据不同的测量目的确定具体的测量内容是人事测量的第一步。测量内容应根据所选拔岗位的任职素质要求，通常可以工作分析、职务说明为依据。
⑵确定测量的基本形式和测量工具。
测量的形式和工具根据测量内容的不同而不同。测量形式和工具的确定也是非常重要的一步。不恰当的测量方法会使测量结果不能满足测量目的，甚至会导致收集到虚假信息，误导决策的制定。
⑶测量的实施与数据采集。
在测量的实施过程中，要注意做到客观化、标准化，保证收集到的测量结果能够公平、真实地反映应试者的状况。在收集测量资料的同时，要注意将实施测量的过程中相关的信息及可能决策产生影响的细节记录下来，作为决策的辅助材料。另外，对测量结果造成影响的特殊因素也应进行记录。
通常，要求测量的现场环境要空气通畅、新鲜，照明充足，温度、湿度适宜，干净整洁，安静，没有外界干扰，每个被测者的桌椅应尽可能舒适，并有足够的空间，尤其避免多个被试者同时应试时相互影响、干扰。
⑷分析测量结果。
对测量结果的分析通常包括对测量结果的计分、统计和解释。使用者只需按照测验说明进行*作即可。
⑸根据分析作出决策或对决策的建议。
决策与测量的目的联系紧密，以选拔为目的的测量，其决策内容为候选人名单；以安置为目的的测量，其决策内容为岗位与应聘者的匹配；以评价为目的的测量，其决策内容为对应试者素质的评价；以诊断为目的的测量，其决策内容为应试者的问题和特长或应试团体的状况和管理问题；以预测为目的的测量，其决策内容为应试者将来的绩效和工作表现。
⑹跟踪检验和反馈。
在多数情况下，需要对测量结果及聘用结果进行跟踪，主要是根据工作绩效对测量结果和聘用进行检验，这就为此前的工作提供了重要的反馈，为测量取得经验性资料，为进一步矫正测量以达到更大的精确度提供了依据。可以说，到这一阶段，才真正完成了一个人事测量作业环路。

人事测量的历史

填空及选择
⒈世界上第一个具有应用价值的心理测验，是FaGuo心理学家比奈制定的智力测验。
比奈的智力测验作为最早的评价、鉴定智力的结构和水平的测量工具，是应社会的需要而产生的。
⒉世界上第一个标准化的人格问卷――武德沃斯编制的“个人资料调查表”，鉴别不能从事军队工作的神经症患者。第一个职业兴趣测验――斯特朗男性职业兴趣量表，广泛应用于职业选择、人才选拔。
⒊历史上最著名的职业兴趣测验有斯特朗－坎培尔职业兴趣测验和霍兰德职业兴趣问卷。它们都通过分析确定职业兴趣而分为六大类：社交型、艺术型、研究型、技能型、事务型、经营型。
⒋燕京大学校长陆志韦先生发表了经修订的比奈－西蒙量表，这就是中国最早的标准化的比奈智力测验。
1979年，北京大学心理学系的吴天敏教授对中国的比奈量表进行第三次修订。
二、名词解释
⒈智力包括一切高级的心理过程，并突出表现在推理、判断、问题解决的能力上。
⒉“1905年比奈――西蒙量表”。量表是说心理测验是一种以人的心理为内容的、有一定量度的量具。就是指测量心理的度量工具。
⒊1905年比奈――西蒙量表是一项个体测验，这是相对于团体测验而言的，因为测验是以单一个体为实施对象而设计的。
团体测验能使我们迅速而有效地同时收集到大量测验者的资料。美国心理学家编制了第一个团体智力测验――陆军甲种测验和适用于母语非英语的被试和文盲被试的陆军乙种测验。
团体测验采用多项选择，而个体测验多采用开放式问题、团体测验多采用客观的计算机计分，而个体测验一般为施测者计分、团体测验为团体施测，个体测验为个体施测、团体测验多用于筛选，而个体测验多用于诊断及弥补工作、团体测验标准化样本极大，一般在几十万左右，而个体测验一般只用几千名精心挑选的被试。
⒋智力年龄即为每一个年龄确定出难度最适宜的题目，用被测者所能完成的最大难度的题目所对应的年龄作为该被测者的智力年龄。
实足年龄：自己本身的生理年龄。
⒌时间均匀性：其智力落后的程度不是保持固定的时间程度不变，而是按照一个比例，越来越大。
⒍智商IQ=100X智力年龄／实足年龄。
计算：一个儿童参加了比奈智力测验，他完成了前14题，即智力年龄为5岁，若他的实际年龄4岁6个月，则比率智商IQ=5/4.5*100%=111%。
⒎离差智商：以标准差为单位计算测验分数偏离平均数的方向和程度。
⒏纸笔智力测验：欧提斯编制的，十分适合于团体施测，其中的多项选择题和其他客观题都是首次采用。这项测验最后编制修订成著名的军队α和军队β测验，即陆军甲种测验和陆军乙种测验，前者为文字测验，后者为非文字测验，专门为文盲和不懂英文的新兵设计的。
⒐人事管理思想：⑴工作的绩效和人的素质有关，要追求高的工作绩效，必须有高素质的人才；⑵不同的工作对人的素质结构的要求不同，必须有针对性地为不同的工作匹配不同的人才，才能确保各种工作的高绩效，做到恰当的人做恰当的事。这也就是最经典的“人――事匹配”的思想。
⒑分化能力性向测验：从语言理解、语言推理、数学推理、抽象推理、空间推理、机械推理等六个方面检测人的智力水平，从而整体分析智力结构。
⒒人格：主要指人所具有的与他人相区别的独特而稳定的思维方式和行为风格。人格同人的工作绩效和工作方式及习惯有关。
⒓场依存性：有的人看待事物比较独立，有自己的主见；有的人则很容易受周围人和环境的影响和暗示，判断事物缺乏自己的标准。
⒔动机是指由特定需要引起的，欲满足该种需要的特殊心理状态和意愿。
⒕一般生活动机是指人们广泛的生活领域中具有普遍性的需求所导致的动机。主要理论有马斯洛的需要层次理论，赫兹伯格的保健－激励理论，奥德佛尔的ERG理论（ERG即生存、关系、成长）。
⒖工作动机是具体指驱使人们工作的原因。麦克里兰提出了三重需要理论：成就动机：即寻求获得成功；权力动机，即寻求获得、保持和运用对他人的影响和支配；亲和动机，即寻求与多数人群保持密切的关系。又提出能力动机，即寻求不断获得、运用和增长才能。
三、简答及论述
⒈简述人格如何影响人？与工作的关系是什么？
人格主要指人所具有的与他人相区别的独特而稳定的思维方式和行为风格。人格同人的工作绩效和工作方式及习惯有关。涉及以下几个方面：
⑴人格会影响人在工作中对事物的理解。
有的人看待事物比较独立，有自己的主见；有的人则很容易受周围人和环境的影响和暗示，判断事物缺乏自己的标准，即场依存性。
⑵人格会影响人处理事物的方法。
有的人处世谨慎，凡事谨小慎微，有的人则不拘小节，放荡不羁，敢于冒险。有的人做事优柔寡断，有的人做事坚决果断等。
⑶人格会影响人在工作中与他人相互沟通的方式。
有的人善解人意，能体察对方心情，有的人则麻木不仁，反应迟钝。有的人善于为对方设身处地地着想，能换位思考，从对方角度看问题，有的人说话善于调侃，调整气氛，有的人说话则过于直率，甚至失于尖刻，易于伤人。
⑷人格会影响人独特的表现方式。
有的人情绪稳定，心气平和，有的人多愁善感，有的人脾气乖戾，喜怒无常。有的人做事我行我素，独往独来，有的人则善于察言观色，或随群附众。有的人做事很讲义气，重情分，有的人则薄情寡义。
由上述可知，不同的人的确会给工作带来不同的结果。这也就要求人事诊断和安置作出相应的考虑并采取相应的方法。
⒉人事测量技术的发展。
⑴出现大量适用于人事管理领域的测验。
Wonderlic人事测验、一般能力性向测验、分化能力性向测验、DISC人格测验等。
⑵面试技术在人才选拔中广泛应用。
面试历来是招聘过程中必不可少的一个过程，企业开始寻求一种客观、公正的面试评估方法，于是，结构化、半结构化的面试在企业大受欢迎，标准化的面试提问表和评分表在招聘中被普遍采用。
⑶人格测验成为人才甄选程序的必要过程。
现代企业开始认识到许多非智力因素，如性格、情绪特质、人际关系技巧、动机、兴趣和态度模式等方面，对工作方式甚至工作绩效都有十分重要的影响。各种对人格进行测量的工具受到企业的欢迎，人格测验成为人才甄选程序的必要过程之一。
⑷针对具体要求的测验设计、组合越来越重要。
由于现代企业对人才素质的要求越来越精细化、多面化，并越来越强调企业自身的特点对人才选拔的要求，人事测量正向迎合具体企业要求和岗位要求的方向发展。于是，在人事测量领域越来越强调针对具体要求设计测验和对测验进行合理组合。
人事测量在企业的人才选拔、培训、考核等领域发挥着重要的作用。随着企业管理科学化的发展，人事测量已成为现代企业人力资源管理的必要工具之一。

林の声音 · 发表于 2005-11-30 02:53:15

人事测量的基本类型

填空及选择
⒈标准化的纸笔类测验的优点：方便性、经济性、客观性。
标准化纸笔测验的不足之处：
⑴受测验的形式所制约，它无法对被测者实际的行为表现进行测量；
⑵纸笔测验的实施较为程式化，我们只能收集到测验中所考察的信息，而对于测验外的信息我们一无所知。
⑶纸笔形式测验中有标准答案的测验如能力测验，并不能完全避免考试技巧和猜测因素的影响。
⒉投射技术一词由富兰克于1939年首先明确提出。
名词解释
⒈纸笔测验就是只用纸和笔就能进行的测验。这类测验在实施过程中，一般不需要借助其他工具和手段。标准化的纸笔测验一般有事前确定好的测验题目和答卷以及详细的答题说明，测验题目往往以客观题居多，但也有不少是主观自陈评价题。有的测验限定时间，有的则不限定时间。一个标准的纸笔测验系统还包括客观的计分系统、解释系统、良好的常模以及值得信服的信度、效度和项目分析数据。
⒉投射测验要求被试对一些模棱两可或模糊不清、结构不明确的刺激作出描述或反应，通过对这些反应的分析来推断被试的内在心理特点。其逻辑假定是，人们对外在事物的看法实际上反映出其内在的真实状态或特征。
⒊公文筐测验是让被试在所安排的假想的情境中扮演某种管理者的角色，对事先设计的一系列文件进行处理，进而针对被试处理公文的方式、方法、结果等进行评价。公文筐测验一般用于对高级管理者的评价，它可以对应试者的计划、预测、决策、沟通等管理能力进行测查，在管理领域应用十分广泛。
⒋面试是考官针对自己感兴趣的、与工作有关的各种问题，与应聘者进行面对面的交谈，收集有关信息，从而达到了解、评价应聘者的目的。
面试按其形式的不同可以分为结构化面试和非结构化面试。
⑴结构化面试往往有事先确定的提问提纲，里面列出需要了解的各方面的问题，而且这些问题通常还可能有一定的内在的逻辑结构。
⑵非结构化面试则没有固定的面谈程序，面谈者提问的内容和顺序都取决于面谈者的兴趣和现场应试者的回答。这种面试方法给谈话双方以充分的自由。
⒌调查法。在人事管理工作中，经常使用的一种测量方法。指就员工的某些意愿、态度、观点或感受等认知性或情感性心理状态或行为倾向，进行一定范围的信息搜集，并就相应状态或倾向的特性、程度、广泛性等作出分析评价，通常由一系列问题构成，可以是纸笔形式，也可以是访谈形式。
简答及论述
⒈投射测验的主要特点。
投射测验的主要特点是它的非结构性、掩蔽性和整体性。
⑴非结构性。指投射测验使用非结构化任务作为测验材料，即允许被试产生各种各样不受限制的反应。
⑵掩蔽性。指测验的目的的隐蔽性，被试一般不可能知道测验的真实目的，也不知道对自己的反应将作何种心理学解释，减少了被试的伪装自己的可能性。
⑶整体性。指测验关注的是对人的总体评估，而不是针对单个特质的测量。
⒉投射测验的分类及实例。
林德塞按照测验所引起的反应性质将投射测验分为五类：
⑴联想法投射测验。
测验任务为报告因某种刺激所引起的联想。罗夏克墨迹测验，测试材料：10张墨迹图，其中5张是黑白的，2张有黑色和红色墨迹，另外3张为淡彩色墨迹图。测验任务：看图片后对图画内容进行自由联想，主试通常问“请告诉我你在图片中看到了什么，或者想起了什么？”回答后主试又将图片展示出来，询问是图片的哪个部分，哪些因素致使被试作出以上联想的。
⑵构造法投射测验。
测验任务为让被试编造或创造一些作品。绘人测验，测验任务：要求被试在一张白纸上用铅笔任意画一个人。画完后，再要求被试画一个与前者性别相反的人。最后，主试可以通过面谈的方式向被试了解他所画人物的年龄、职业、爱好、家庭、社交等信息。最后测验者对被试的作品进行分析。
⑶完成法投射测验。
测验任务为让被试对一项不完整的材料进行填补使其完整，如语句完成法。罗特未完成句子量表，测验任务：要求被试将一系列句干补充成完整的句子。通过被试的反应可以对被试的家庭态度、社会与性态度、一般态度、品格态度进行解释。
⑷选择或排列法投射测验。
测验任务为让被试将一些刺激按照某种原则进行选择或予以排列。可以让被试将一些描述人性格的词按照其好恶程度或适宜程度排序，从顺序中可以分析出被试的人格。
⑸表露法投射测验。
测试任务为让被试利用某种媒介自由地表露自己的心理状态。可以通过书写、谈论、歌唱、绘画等形式让被试自由表达，从中分析其人格。
⒊对投射类测验的评价。
通过投射技术可以使被试不愿表现的个性特征、内在冲突和态度更容易地表达出来，因而在对人格结构、内容的深度分析上有独特的功能。但对于投射测验一直存在相当多的批评：
⑴由于投射测验结果的分析一般是凭分析者的经验的主观推断，其科学性有待进一步考察。
⑵投射测验在计分和解释上相对缺乏客观标准，人为性较强，不同的测验者对同一测验结果的解释往往不同，并且，投射测验的重测信度也很低。
⑶投射技术是否能真正避免防御反应的干扰，在研究上并未得出一致结论。
投射测验除具有上述缺点之外，在应用时还有如下不便之处：
⑴投射测验一般为个体测验，不仅测验时间长，分析结果所需要的时间也很长，实施起来耗费精力。
⑵投射测验对主试和评分者的要求很高，一般只能由经验丰富、有专业背景的人担当。
⑶对投射测验结果的评价带有浓重的主观色彩，不能满足人事测验的公平性原则。
⒋行为观察法。
行为模拟与观察类测量的技术核心是行为观察法，它是通过安排一定的情境，在其中观察特定个体（或群体）的特定行为，从中分析所要考查的内在素质或特征。行为观察法可以分为自然观察法、设计观察法和自我观察法。
⑴自然观察法。是观察者在真实的生活或工作情境中对个体的行为进行直接观察的方法。在企业中，可以尝试在考核中引进客观的自然观察方法。人事经理可以在考核前选定任意一个工作时段，在不被员工发觉的前提下对员工的工作行为进行观察，并作客观详细的记录，该记录资料可以作为考核的依据。
⑵设计观察。一般很难有机会在自然状态下遇到这种观察机会，这就需要采用设计观察法，即在人为设计的环境中观察特定的行为或反应。在人事测量领域经常用的设计观察方法有情境压力测验和模拟情境测验两种。
情境压力测验由主试向被观察者布置一定任务和作业，借以观察个体完成任务的行为。工作样本测验、无领导小组讨论都可算做情境压力测验。
工作样本测验中，主试通常向被试布置一项工作任务，要求被试在一定时间内完成，观察者对被试完成任务的行为过程和行为结果进行观察和评估。
无领导小组讨论是安排一组互不相识的应聘者（通常为6-8人）组成一个临时任务小组，并不指定任务负责人，请大家就给定任务进行自由讨论，并拿出小组决策意见。
无领导小组讨论可以对三方面的内容进行测量：
个人特点：自信心、挑战性、自我表现的主动性、主动寻求他人同意和赞赏的技巧等；
社交能力：言语表达的流畅性、组织性和逻辑性，对他人的说服力，倾听的技巧等；
领导意识和领导能力：主动扮演领导角色的倾向、对进程的控制能力、意见综合能力等。
模拟情境测验是指通过模拟一个尽可能接近真实工作情境的环境，要求被试完成某项任务，对被试的完成任务的行为过程及行为结果进行观察、评估。模拟情境测验与情境压力测验的唯一区别就是在模拟情境测验中被试处在一个假定的情境中，这个假定情境可以根据测验的需要不断变换，以充分考察被试在不同情境中的表现。
角色扮演测验是通过赋予被试一个假定的角色，要求按照角色的要求表现自己的行为，观察记录并评价角色扮演的行为，评价角色接近程度或胜任力。
⑶自我观察。是由被试自己对自己的行为进行观察，并记录自己行为的方法。有利于被试对自己行为的监控。企业中常采用的“工作日志”就是自我观察的一种应用。
⒌对行为模拟与观察类测量的评价。
行为模拟与观察类测量的最大弊端，是它*作的困难性。这类测量对主试的要求很高，且这类测量通常只能逐个进行，测量的成本很高。这类测验的结果分析也很复杂，分析过程容易有较大的人为化倾向，其客观性受到影响。
行为模拟与观察类测量具有如下优点：
⑴通过行为测量可以观测到被试在具体情境下的真实行为，比对行为的自我评估，其结果更容易令人信服。
⑵通过对情境的*作，可以使测试情境与将来的工作情境尽可能相似，所测量出的结果具有很好的预测效果。
⑶在行为测量中，被试的个人特点和能力可以得到充分的展示。通过对情境的设计，考官可以成功地观测到许多他所想要考察的行为和能力。
 如何建立人事测量工具

填空及选择
⒈要建立一项完善的人事测量工具，目标设定是第一步。
⒉根据测量目标确定测量的内容和形式：确定测量内容和形式是决定性的关键，它决定测量有效与否。
⒊根据测量的对象确定题目的形式：在编制测量工具时，还应该考虑使用测量工具的团体的组成和特点，如被试的年龄、智力水平、受教育程度、社会经济地位、文化背景、阅读水平等因素。测量工具针对的对象不同，测量工具采取的形式、题目的编写、测量题目的难度、取样的范围都可能有所不同。
⒋一般在客观题的测验中，为了可供筛选，编写出的题目应比实际需要多20%以上，如考虑到以后还要不断筛选和修改，初次编写的题目可以比实际需要的多出一倍到几倍。
⒌题目的编排：选择和编排过程包括定性的逻辑分析和根据预测的结果进行的定量分析。
⒍对题目进行初步选择的主要依据是：题目本身的性质、对预期测量目标的可测量程度。这一步可细分为如下几个步骤：
⑴检查题目是否符合细目表中某一单元格内容的要求；
⑵根据细目表对各部分所要求的比例选择适当数量的测试，使测量工具尽量覆盖整个细目表的内容；
⑶检查题目是否叙述明确清楚，是否提供了额外线索；
⑷检查题目十分适合将要施测的对象和施测的条件；
⑸检查题目的难度是否恰当，一般来说，难度定为0.50（50%的人答对此题）较为合适（对能力、技能类的题目要求除外）；
⑹检查所选择的题目是否彼此独立，没有重叠，即回答某一问题所需的知识与能否回答其他问题无关。
在选择题目时还要注意测量工具的长度。在一个测量工具里究竟包括多少题目比较合适，既要看是否能完全满足测量目的的要求，也要根据测量工具的时间限制和被试的年龄和阅读水平而定。
⒎题目的最佳编排的一般原则：
⑴将测量相同因素的测试题排列在一起；
⑵尽可能地将同一类型的测试题组合在一起；
⑶难度测验的题目应按由易到难排列；
⑷对于人格测验，应尽量避免将测量同一特质的题目编排在一起，防止被试猜测出题目所要测查的因素。
⒏对题目的选取只是依靠编写者的主观经验，题目的效果如何还需要进行定量的客观分析。这时的测试题还只能叫做预备测试题，还需要获取被试对这些题目的反应的材料，为进一步筛选题目和为编排测量工具提供客观依据。
必须将预备测试题对一定规模的小样本被试进行施测，获得数据以进行校验、修订。这一过程称为测试题的预测试。
⒐数据收集上来之后，就应该利用这些数据对题目进行分析，删除不好的题目或对题目进行修改，这个过程称为题目分析，具体内容包括对题目的项目分析和对测验信度、效度指标的检查。
⒑对测试题的预测试应注意以下问题：
⑴预测试对象必须和将来正式测试的对象相似；
⑵预测试的实施过程与情境应力求与将来正式测量工具实施时的情境相似；
⑶预测试的时限可稍宽些，最好使每个被试都能将题目答完，以便搜集充分的反应资料，使统计分析的结果更为可靠；
⑷在预测试过程中，应将被试的各种反映情况随时加以记录。题意不清之处，在修改测验时作为参考。
⒒根据预测结果进行题目分析，对每个题目的具体分析称为项目分析，主要是指根据题目的难度、区分度、备选答案的合适度等数量指标来对题目进行分析。
简答及论述
⒈显示性测量与预测性测量的区别与联系。
显示性测量反映被测者具有什么知识和特点，能完成什么任务。如成就测验、态度测验就是显示性测量。
预测性测量：工具帮助观测一个人在不同情境下的行为。如能力倾向测验可以预测个体将来的工作绩效。角色扮演、公文筐测验能够直接预测个体将来在同样的工作情境中的工作表现。
⒉目标分析与任务分析。
在实际过程中，测量工具的编制者还必须把测量目标转换成可*作的测量指标，这种转换过程称之为*作化或目标分析过程。
目标分析与测量目标是密切相关的。根据测量目的的不同，我们区别以下三个情况来具体分析：
⑴对于有选拔和预测功用的预测性测量工具，主要任务是要对所预测的行为活动做具体分析，故称之为任务分析或工作分析。包括两个步骤：首先要确定，为了使所预测的活动达到成功，需要哪些心理特质和行为。其次，还要建立衡量被试成功与否的标准，称之为效标。效标可以作为鉴别测量工具的预测是否有效的重要指标。
⑵如果测量工具用于测量一种特殊的心理品质或特质，首先必须给所要测量的心理和行为特质下定义，然后找出该特质往往通过什么行为表现出来。
⑶测量工具是描述性的显示测验，它的目标分析的主要任务则是确定所要显示的内容和技能，从中取样。成就测验就是一种典型的描述性显示测验。
双向细目表是一个由测量的内容材料维度和行为技能维度所构成的表格，它能帮助成就测量工具的编制者决定应该选择哪些方面的题目以及各类题目应占的比例。如果要检查新员工培训班的培训效果，那就需要采用成就测验。这种成就测验的内容，就可以利用双向细目表来确定。
“测量工具的编制和实施”课程内容的测量工具细目表
行为内容（材料）目标测量工具准备(16%)测量工具编制(26%)实施(16%)记分(22%)项目分析(22%)工作分析匹配题关系效应记分键效标概念效标事件混合螺旋式晕轮效应组合记分内部一致性知识显示性测量工具反应定势机器记分测量工具同质性(3题)(5题)(2题)(3题)(3题)教育目标分类的问答题和客观题的测量工具成问答题记分决定项目的效度具体类别优点和缺点就的影响因和客观题记的方法事实素分的原则项目分析的目的知识(2题)(4题)(2题)(3题)(3题)解释编制测量工具标准化记分起加权P和D关系的解释理解计划的目的的作用(2题)(0题)(1题)(1题)(1题)编制测量工具领域测量理解、应用、分编制测量工猜测的修正难度和区分度的某一单元的双向细析综合、评价的多选具指示语加权计算应用目表题实例使用图表对重排题记分(1题)(4题)(2题)(4题)(4题)总数(8题)(13题)(7题)(11题)(11题)⒊测验题目的来源。
收集题目的方法有很多，包括从现成的测验中选取、按照现有理论设计、请专家设计等。如编制态度测量量表，则有关态度的类型、定义等理论都有参考和指导作用。专家无疑是设计测验的重要资源。在收集题目时应注意几个问题：
⑴题目的来源要尽可能地丰富，这样测量内容不至于偏颇，并能提高行为样本的代表性；
⑵题目要有普遍性，尤其是成就测验，要保证所有施测对象都学过该测验中题目所包含的内容；
⑶在编制智力或能力等本身不应体现文化影响的内容的测量题目时，要尽量避免文化背景差异的影响。
⒋题目编写的原则。
对测量工具题目进行编写要遵从某些一般原则，这些原则可以归纳为内容、语言、表达与理解这四个方面。
⑴针对题目内容的原则。
要求题目的内容符合测量工具的目的，避免贪多而乱出题目；
内容取样要有代表性，符合测量工具计划的内容；
各个试题必须彼此独立，不可互相重复或牵连，切忌一个题目的答案影响对另一个题目的回答。
⑵针对题目语言的原则。
使用准确的当代语言，不要使用古僻艰深的词句；
文句简单扼要，既排除与解题无关的陈述，又不要遗漏解题的必要条件；
最好一句话说明一个概念，不要使用两个或两个以上的观念；
意义必须明确，不得暧昧或含糊，尽量少使用双重否定句。
⑶针对题目表达的原则。
尽量避免主观性和情绪化的字句；
不要伤害被试感情，避免涉及社会禁忌或隐私；
避免诱导和暗示答案；
避免令被试为难的问题。
⑷针对题目理解的原则。
题目应有确切答案，不应具有引起争议的可能；
题目内容不要超出受测团体的知识和能力范围；
题目的格式不要引起误解。
⒌题目的分类。
题目的种类很多，根据被试所作出的反应方式进行分类，可分为提供型和选择型题目。
⑴提供型题目：要求被试提供答案，如问答题、填充题。另外，各种*作性题目，如画图、表演、完成某项任务、回答问题等，都可算做提供型题目。
⑵选择型题目：要求被试在提供的备选答案中选择正确答案，如是非题、匹配题、选择题。
⒍测验题目可分为几种类型，并举例说明。
⑴问答题：指示语：试以2000字说明下述问题：①比较问答题和客观题的优劣；②解释进行课堂测量工具项目分析的理由。
⑵填充题：指示语：在每个空格内填上合适的字句：①客观测量工具的客观性的关键是：＿＿＿＿；②编制一个预测某种工作成功程度的测量工具的第一个步骤是：＿＿＿＿。
⑶是非题：指示语：如果该题正确，请在“是”上划“√”；若该题不正确，请在“否”上划“√”。是否①心理测量工具只是心理测量的方法之一。
⑷匹配题：指示语：请在右栏选择合适的答案的编号，填在左边每题的编号前。
＿＿①团体智力测量工具 a.比奈
＿＿②个体智力测量工具 b.达尔文
＿＿③兴趣问卷 c.高尔顿
＿＿④人格问卷 d.欧提斯
＿＿⑤线性相关 e.皮尔逊
＿＿⑥感知觉测量工具 f.罗夏克
g.斯皮尔曼
h.斯特朗
i.伍德沃斯
⑸选择题：指示语：下面哪个答案最合适？
＿＿①“决不”、“有时”、“总是”等定语，常常会对毫无所知的被试产生暗示作用。我们称这些词语为
a.普通修饰词 b.连词 c.反应定势 d.特殊决定词
⒎常用题目类型与编制要领。
⑴问答题。优势：①较好编制，题目无需太多；②不需准备备选答案，答案是由被试自己生成的；③可以避免被试随机猜测答案的可能。
存在的问题：①问答题一般回答时间长，占分类大，因此题量不宜太大，所以能测量到的内容也有限，对行为的取样受到局限；②问答题的评分标准也不容易标准化；③问答题的评分容易受书写的整洁程度、个人成见等无关因素的影响。
 在编制时应注意以下几点：
问题应清楚而且明确，使被试了解答题要求；
题目的数量不要太多，以免变成速度测验；
在编制题目时应该有一个理想答案或一系列答题标准，同时对另外一些可接受的答案应有所规定和说明。
⑵选择题。优点：①适用范围广，从一般知识到复杂能力的测量均可使用；②题意明确，被试的反应简单，容易计分；③与其他形式的客观题相比，更少受猜测和反应定势的影响，评分较为客观；④选择题的题量可以较大，考察的范围更广，取样代表性较高。
选择题的不足之处：①诱答难以编制，诱答的数量要求多，而且还要似是而非，让那些不知道正确答案的被试感到无从选择；②通过选择题较难测出个体组织能力、表达能力和创造性等特点。
编制选择题的一般原则：
题干所提出的问题必须明确，使用简单而且清晰的用词。做到即使被试不看选项的情况下，题干本身的意义也是完整的。
不要将选项夹在题干中间，或者在题干前出现与问题无关的材料；
选项要简练，尽量将选项**同的词句移至题干中。这样不仅可以使题意清楚，而且可以减少被试的阅读时间。
⑶是非题。缺点：①容易受被试反应定势和猜测的影响；②是非题仅有两种答案，即使猜测，也有50%答对的可能性。弥补这一缺陷的方法之一，是加大题目数，使每一题目分数的偶然性对总分的影响相对减小。
反应定势是指部分被试在回答问题时，其答案的选择建立在题目的形式或位置上（如偏向正面回答或否定回答），而不是建立在题目内容的基础之上。
是非题也有其长处。它能很快书写和阅读，因此题量可以较大，便于广泛取样；记分也比较客观。在能力测验中，是非题多用于只需快速粗略判断被试能力的情况。在人格测验中，多用于只需判断一般普遍行为的问卷中。
编写是非题时要注意以下几点：
测查的内容应以有意义的事实、概念或原理为主，不要考察被试对无关紧要的问题或琐碎的细节的辨别能力。
每道题只能包括一个重要的概念，避免两个以上的概念出现在同一题目中，造成“半对半错”或“似是而非”的情况。且还要把各个概念放在题干的重要位置上。
决定一个题目是否正确，应以重要的概念为基础，不要着重于对次要的或琐碎的观念的判断。
除特殊情况，尽量避免否定的叙述，尤其要避免双重否定的叙述。
测验中正确的题目与错误的题目，它们的长度、复杂性应尽量一致。
正确的题目数与错误的题目数应该基本相等，两种题目应按随机方式排列。
⑷匹配题。一般包括多个反应项（匹配项）和多个刺激项（被匹配项），用反应项来匹配刺激项。匹配题有完全匹配（刺激项与反应项的数量相等）和不完全匹配（反应项目多于刺激项目）两种形式。通常，刺激项目和反应项目分别排成两列。
好处：匹配题容易编制，而且可以在短时间内测量大量相关联的材料，覆盖面较广。但它一般只能测量简单记忆的事实材料或概念关系，并且要求编制的选项必须是同质的。
对编制匹配题的一些建议：
刺激项目和反应项目应该分成两列，通常反应项安排在右边；
配对数目不可过多或过少，最好使用不完全匹配，使反应项数目多于刺激项数目，并且最好不限制每个反应项被选择的次数，这样可以降低猜测的概率；
匹配题的反应项与刺激项，其性质必须相近；
应对匹配方法、匹配的依据加以明确的规定和说明，同时说明反应项可以被选择的次数；
同一组的反应项与刺激项最好印在同一页纸上，以免造成答题时间的浪费；
反应项与刺激项应以不同形式的序号加以标识，以免混淆。
⑸填充题：编制填充题时应注意的几个方面：
最好采用问句形式；
使用直接问句的形式，可避免产生对题意的误解；
如果是填空形式，填充处不可太多。过多空白会使题意不明确；
每题最好只有一个答案，答案最好简短而具体，有利于评分。
⑹*作性测量形式。*作测试题要求被试对未来真实情境中的行为进行模拟，其真实性要高于纸笔测验。*作性测试题通常分为着重过程和着重结果两种形式。
*作性测试有多种不同的分类方法，按测试情境的真实性程度可分：①纸笔的*作性测试：虽用纸笔但偏重于模拟情境下知识的应用，如编制某项*作计划、步骤、注意事项等，如公文筐测验；②模拟*作测试：强调正确的程序，被试需要在模拟情境下完成与真实活动相同的动作，如驾驶员的考核等；③工作样本*作测试：其真实性最高，但是是在有控制的条件下去完成的。如司机在标准场地内的考核。
设计*作性测试题的主要原则有：
明确所要测量的目标，并将其*作化。即要进行工作分析，辩认出*作中最重要的因素，找出具有代表性的工作样本。
要建立作业标准，规定通过此项作业的最低标准。这些都应该*作化。
选择合适的真实性程度。通常情况下，真实性程度越高，模拟的代价越大。
指示语简单明确，让被试知道要干什么和在什么条件下去做。
有明确的计分方法。
作品量表一般包括一系列按顺序排列的不同作业程度、水平、质量的标准样本，评分时参照这些标准样本对被试结果进行评分。
⑺面试。缺点：①面试的考核缺乏心理测量学的严格性，易受考官的个人偏见或歧视的影响；②由于面试既要看应试者对问题回答的内容、质量，还要看整个面试过程中的行为表现，如情绪紧张度、应变能力等，更加大了面试记分的难度。面试效果的好坏往往取决于面试考官。
面试应注意：①面试考官必须对面试主题有充分的了解，对于所要求的反应有清晰的认识；②用于描述或评定被试反应的词语，必须具体化，避免模糊不清的陈述。
⒏编制测验的步骤。
⑴确定测验目的；⑵确定测验性质；⑶确定测验内容；⑷制订测验计划；⑸筛选题目；⑹测验的标准化；⑺对测验的技术分析和鉴定；⑻编写测验指导书。
人事测量的实施与计分

填空及选择
⒈编题时要注意的要点：在能力和成就测验中所使用的时限，以大约90%的被试能在规定时间内完成测验为标准。
⒉标准化测量要求对测验结果进行客观计分。检验客观与否，可以以两个或两个以上受过训练的合格评分者所评结果之间的一致性作为指标。一般情况下，受过训练的评分者之间的平均一致性达到90%以上，我们就认为计分是客观的。
名词解释
指示语是在测量实施时说明测量进行方式以及如何回答问题的指导性语言。指示语通常有两种：一种是对被试的，另一种是给主试的。
简答及论述
⒈主试的职责。
主试，也称考官或主考人，是控制测试进程的主要人员。主试的经验如何往往会对测验的结果产生影响。对于个体测验、投射类测验、*作性测试和面试，主试的作用就更为重要。主试应做以下工作：
⑴测验前的准备工作。
预告测验。事先通知被试；
熟悉测验指示语。
准备测验材料。
熟悉测验的具体程序。
确保满意合适的测验环境。调整光线、通风、噪音水平等物理条件。另外，为防止作弊，还要妥善安排座位等。
⑵测验中主试的职责。
在测验中，主试的主要职责是按照指示语的要求实施测验，在被试询问指示语意义时，作进一步澄清，但注意不要作任何暗示。主试还要注意不要讲与测验无关的话。
⑶建立协调关系。
协调关系指的是主试和被试之间一种友好的、合作的、能促使被试最大限度地做好测验的一种关系。
⒉主试对测量结果的影响。
⑴主试的人格特点。
主试的不同特点对测验的实施及测验的评分等各环节都有影响。有些主试可能自己就不大善于建立和处理人际关系，对他来说在测验实施过程中与被试建立协调关系较为困难，因而由他施测的被试的测验结果可能就会受到影响。
⑵主试的期望。
在有些情况下，实验者所获得的资料及实验结果会受其本身期望的影响，这种现象称为罗森塔尔效应，也称实验者期望误差。
主试对测验结果的影响仍是有限的，是可以通过一定方法有效克服的。要力求做到测验实施过程的标准化，将主试的个人因素对测验结果的影响尽可能降到最低。
⒊被试特点对测量结果的影响。
⑴测验的技巧与练习因素。
测验的技巧。必要时，可以增加练习测验，使所有应试者同等程度地熟悉测验形式。
练习效应。练习因素所产生的影响可归纳为以下几点：
教育背景较差和经验较少者，其受练习因素的影响较为显著；
着重速度的测验，练习效果较为明显；
重复实施相同的测验，受练习影响的程度要大于施测复本测验；
练习的影响仅限于第一次及第二次重测，第二次以后的影响微不足道；
平均而言，练习因素影响的幅度约在0.2个标准差以下。
⑵焦虑和动机因素。
应试动机。被试参加测验的动机不同，会影响其回答问题的态度、注意力、持久性以及反应速度等，从而影响最后测量结果。
测验焦虑。焦虑是一种不愉快的、表现为焦急、恐惧和紧张的情绪体验，它主要是由于对可能出现的测验结果的担心或对应付测验结果的能力的担心而造成。大多数人在测验前和测验中感到焦虑，故又称测验焦虑或考试焦虑。
⑶反应定势。
也称反应的方式或反应风格，简单地说，就是每个人回答问题的习惯方式。由于每个人回答问题的习惯不同，可能会使有相同能力的被试获得不同的分数。影响测量结果的反应定势主要有以下几种：
求“快”与求“精确”的反应定势。有些被试反应特别谨慎，体现为求“精确”的反应定势；另外有些人则特别快而且粗心大意，这就是求“快”的反应定势。
反应时间应以90%的被试可以答完所有试题为准。
偏好正面叙述的反应定势。被试在无法确定“是非题”的正确答案时，选“是”的人多于选“非”的人。这种定势又称肯定反应定势。
偏好特殊位置的反应定势。被试如果完全不知道选择题的正确答案，则不会以完全随机的方式来决定该选择哪一个选项，而有偏好某一个位置的选项的倾向，也称位置定势。
偏好较长选项的反应定势。有人发现被试在无法确定正确答案时，有偏好选择较长选项的反应定势。
猜测的反应定势。
⒋猜测的校正。
⑴猜测修正的方法。
S=R-W/(n-1) 
其中，S是正确分数，R为被试答对的题目数，W为被试答错的题目数，n选项数目。
计算：一份试卷由100个客观题组成，每题1分，每个客观题都有5个备选项，甲应试者完成了整份试卷，答对了70题，请问猜测修正后，甲得62.5分。另有乙完成了90题，也答对了70题，乙得65分。S甲=70-30/（5-1）=62.5；S乙=70-20/（5-1）=65。
⑵猜测修正的优缺点。
赞成使用猜测修正公式的人认为：
修正公式可避免减低测验的信度。
修正公式可以反映被试真正的能力水平。
使用修正公式对那些不能答完全部试题的被试来说比较公平。
反对使用猜测修正公式的人则认为：
公式假设不成立，答错试题，是因为观念模糊、记忆不清或粗心大意，并非乱猜。
只要所有被试能答完全部题目，或者是略去未答的题目数相同，则猜测修正无实质作用。
未采用猜测修正对信度并无重大影响。
实际生活中，常常需要仅凭部分知识来作判断，因此完全不许猜测也与实际生活不符。
⑶在编制测题时要注意：
选项数目要多，4-5项较合适；
题目数量加多；
时间要充裕；
经常以项目分析评鉴试题，并淘汰不好的试题。
⒌计分的一般程序。
⑴计分的基本步骤主要有三步：
①记录反应。②检索标准答案。③反应和标准答案的比较。
⑵问答题计分。
问答题的主要缺点是评分不够客观，也就是说问答题的计分经常受到评分者的情感、态度的影响。问答题中常见的误差有：宽容定势和晕轮效应。宽容定势指主试的计分过于宽松，即使没有回答出题目所要求的答案，评分者也给予较高的分数；晕轮效应指给予被试某道题较高分数仅仅是由于被试在另外一些试题上获得了高分，也就是说对被试的一般印象影响到具体某个问题的评价。
为了使问答题的计分更加客观和可信，主试应该首先考虑采用何种计分程序：整体计分还是分析计分。整体计分就是评分者根据总体印象给答案评一个总分。整体计分在实际中应用较为普遍。分析计分是给问答题的不同部分分派不同的权数，按照各部分的要求对答案中所包括的信息和技能评分，最后将各部分的权数和得分组合起来得到该问答题的分数。分析计分往往有答题的详细标准。
⑶客观题计分。
客观题的一个主要优点就是计分简单、客观。
信心权数：多大程度上在给出的答案是正确的。伊贝尔是非题加权方法是信心权数应用。
 人事测量结果的解释

填空及选择
⒈人事测量的解释不同于测量实施本身，它们是测量中两个不同的、相对独立的成分，即测量过程与结果评价是相对分离的。测量实施的主要目的是获得应试者的各种反应信息，而分数的解释是利用这些反应信息对个体的素质或特点作出评价的过程。
⒉人事测量的目的在于评价和比较应试者各方面的素质和特点。
⒊确定常模样本的过程包括：确定一般总体、确定目标总体、确定常模样本三个步骤。
⒋在最终确定常模样本的结构时，有许多可能的影响因素是需要考虑的。测验性质的不同，文化教育水平不同，性别的不同，都可能影响常模。
⒌常用的常模有发展常模、百分位常模和标准分数常模。
百分位常模包括百分等级、四分位数和十分位数。
PR=100-100×(R-0.5)/N
计算：某企业对所有400名职员进行了某项技能考核，总分为100分，员工最高得分为99分，最低得分为40分，甲得了75分，在所有员工中排160名，请问甲的百分等级PR=60.13。由于400个数据较多，作分组统计，分40-49，50-59，60-69，70-79，80-89，90-99共6组，70-79分组中有8人次，70分以下的共248人次，求甲的PR=63。
未分组：PR=100-100*（160-0.5）/400=60.13
分组：PR=100/400*[（75-70）*8/10+248]=63
⒍常见的标准分数有：z分数、Z分数、离差智商(IQ)、T分数、标准九分等。由原始分数转换的标准分数，又分为线性转换和非线性转换两种。
z分数是指以标准差为单位所表示的原始分数与平均数的差距。z=(X-X)/SD，Z=A+Bz
当原始分数不呈正态分布时，进行面积转化，而使分数转成为正态分布。由这种方式所得到的分数就叫正态化的标准分数。正态化过程主要是先将原始分数转化为百分等级，再将百分等级转化为正态分布上相应的离均值，并可以表示为任何平均数和标准差。
T分数：用Ｔ分数来表示任何正态化与非正态化的转化标准系统。
标准九分是另一较知名的标准分数系统，其量表是一个9级的分数量表。它以5为平均数，以2为标准差。
名词解释
⒈测量的解释是一个相当复杂的系统程序，它是以一系列复杂的统计工作为基础的，并在很大程度上依赖于专业人士的脑力劳动。
⒉原始分数是通过将应试者的反应与标准答案相比较而直接获得的，其本身并不具有多大的实用意义，而只是一个理论上的过渡值。
⒊原始分数通过与常模的比较，可以转换成等值的导出分数，叫做标准分。
⒋参照常模解释分数通常是将应试者的分数与某个参照团体的分数进行比较，并以该分数在这个团体中的相对等级或相对高低位置来描述应试者的素质或特点。
简答及论述
⒈比较常模参照解释和效标参照解释。
由测量的原始分数通过与常模的对照得到可供比较的导出分数的过程，就是测验分的解释形式之一，称为测量分数的常模参照解释。
测量分数的另一种解释方式是参照效标的分数解释，即效标参照解释，它是依据外在效标作为标准来对应试者的分数进行解释。
常模参照解释与效标参照解释的区别在于：常模参照解释是将应试者的成绩与同类群体的其他人（常模样本）的成绩进行比较，而效标参照解释是将应试者成绩与外在效标进行比较。
⒉常模样本的条件。
在确定和选择常模样本时，要注意下列要求：
⑴常模样本的构成必须明确。
在选取常模样本时，首先要保证常模样本的所有成员是同质的。
⑵常模样本必须是所测群体的代表性样本。
常模样本应能够代表测验总体，常模样本的分数分布应尽量与总体分数分布相吻合。
⑶样本大小要适当。
常模样本大小由以下三方面决定：
常模样本大小决定于总体的规模。总体规模小，常模样本应包括所有总体成员。如果总体数目大，相应的样本也应较大。
常模样本大小决定于总体性质。总体只有单一性质，则适当数目的样本就能够反映总体性质。总体性质越复杂，越需要较大数量的样本。
常模样本大小决定施测结果。希望提高样本的准确度，也就是说减小样本的标准误，则样本数目应随之扩大。样本大小适当的关键是样本要有代表性。
注意常模的时效性。常模必须定期修订。
⒊取样的方法。
取样是指从目标人群中选择有代表性的样本的过程。从统计角度看，取样的方法有随机抽样和非随机抽样两种。在确定常模时，常用的取样方法有：
⑴简单随机抽样。
按照随机顺序表选择被试作为样本，或者是将抽样范围中的每个人或者每个抽样单位编号，随机选择，以避免由于标记、姓名或者其他社会赞许性偏见造成抽样误差。
⑵系统抽样。
具体方法：假设总体数目为N，若要选择K分之一的被试作为样本，则可以把所有的人N分为N/K组，每个组选一个人，则刚好组成1/K的样本。或者把所有的人从1到N按序编号，把所有编号是K的倍数的人抽取出来，即可组成所需样本。
需注意的是，在进行系统抽样时，分组和从组中抽取，或者是编号，都必须是随机的。
⑶分组抽样。
在总体数目较大，无法编号，并且总体成员又具有多样性的情况下，可以先将群体分为一定的小组，再从小组内随机抽样。
⑷分层抽样。
在确定常模样本时，最常用的是分层抽样方法。分成若干层次，再从各层次中随机抽取若干个案。
优点：分层抽样能够避免简单随机抽样中样本集中于某种特性或缺少某种特性的现象。它使各层次差异显著，同层次保持一致，增加了样本的代表性。使用分层抽样方法获得的常模在解释测验分数时更为实用和有效。
分层抽样的两种方法：①分层比例抽样法：如果各层抽取的个案数目ni是根据各层的个案数目Ni占总体数目N的比例而决定的。ni＝Ni/N×n
②分层非比例抽样：有些层次的重要性大于其他层次，这时应该采用非比例抽样方法。
⒋常模的表示方法。
常模表示的方法主要有两种：转化表和剖析图。
⑴转化表。
最简单而且最基本的表示常模的方法就是转化表，也叫常模表，它由原始分数表、相对应的导出分数表和对常模样本的具体描述等三个要素组成。
根据转化表进行解释时，必须注意：常模转化表总是特异性的，即一个转化表总是来自特定的常模样本的，这种转化表只能表示被试在常模样本内的相对等级，若要依此作出某种结论或预测，需要进一步的信度和效度的依据。
⑵剖析图。
是测验分数的转换关系用图形表示出来的一种模式图。可以很直观地看出被试在测验以及测验的各个子测验或维度上的分数及其相对的位置。
要注意的一个问题是，使用剖析图容易夸大各个测验间分数的差异。为避免这个问题，有些剖析图注明了多少距离代表两分数间差异显著。
⒌内容参照分数和结果参照分数有什么不同？它们的意义是什么？
效标参照测验关心的是应试者是否达到了某种标准或效标。参照效标的分数解释分为内容参照分数的解释及结果参照分数的解释两种类型。
⑴内容参照分数的测量目的是确立应试者对某个确定材料内容或技能的掌握和熟悉程度的分数。
编制内容参照测验量表的关键是预先制定一个判断应试者是否已掌握某种内容或技能的熟练程度的标准。这种标准可以通过掌握分数和正确百分数来表示。掌握分数通常以80%-90%的人能通过的分数作为最低分数。
⑵结果参照分数是将效标材料直接结合到测验结果的解释过程而进行评价的分数。预测性测验往往适合用结果参照分数进行解释。结果参照分数可以表示获得某个分数的应试者达到某种效标水平的可能性。

人事测量的关键技术：信度

填空及选择
⒈信度主要是指测量结果的可靠性或一致性。
⒉信度高低的指标通常以相关系数表示，称为信度系数。信度系数一般是同一样本所得的两组资料的相关，在理论上表示为实得分数与真实分数相关的平方：rxx=rxr2=ST2/SX2
⒊信度系数的分布是从0.00-1.00的正数范围，代表了从缺乏信度到完全可信的所有状况。说明可以接受的信度水准，一般来说，当rxx＜0.70时，不能用测验对个人作评价，也不能在团体间作比较；当rxx＞0.70时，可用于团体间比较；rxx＞0.85时，可用于鉴别个人。
简答及论述
⒈信度类型和相应的评估方法。
⑴重测信度又称为稳定性系数，它的计量方法是采用重测法：用同一测验，在不同时间对同一群体施测两次，这两次测量分数的相关系数即为重测系数。
在进行重测信度的评估时，应注意两个重要问题：
重测信度一般只反映由随机因素导致的变化，而不反映被试行为的长久变化；
不同的行为受随机误差影响不同。
⑵复本信度，它是以两个测验复本来测量同一群体，然后求得应试者在这两个测验上得分的相关系数。复本信度的高低反映了这两个测验复本在内容上的等值性程度。两个等值的测验互为复本。
计算复本信度的主要目的在于考察两个测验复本的题目取样或内容取样是否等值。主要优点在于：
能够避免重测信度的一些问题，如记忆效果、练习效应等；
适用于进行长期追踪研究或调查某些干涉变量对测验成绩影响；
减少了辅导或作弊的可能性。
复本信度的局限性：
如果测量的行为易受练习的影响，则复本信度只能减少而不能消除这种影响；
有些测验的性质会由于重复而发生改变；
有些测验很难找到合适的复本。
⑶内部一致性信度，重测信度和复本信度分别注重考虑测量跨时间的一致性和跨形式的一致性，而内部一致性信度系数主要反映的是测验内部题目之间的关系，考察测验的各个题目是否测量了相同的内容或特质。内部一致性信度又分为分半信度和同质性信度。
分半信度是通过将测验分成两半，计算这两半测验之间的相关性而获得的信度系数。采用这种方法估计信度系数。
同质性信度是指测验内部的各题目在多大程度上考察了同一内容。同质性信度低时，即使各个测试题看起来似乎是测量同一特质，但测验实际上是异质的，即测验测量了不止一种特质。同质性分析与项目分析中的内容一致性分析相类似。在某些情况下，也可以作为效度的一种指标。
⑷评分者信度是指不同评分者对同样对象进行评定时的一致性。最简单的估计方法就是随机抽取若干份答卷，由两个独立的评分者打分，再求每份答卷两个评判分数的相关系数。这种相关系数的计算可以用积差相关方法，也可采用斯皮尔曼等级相关方法。
⒉影响信度的因素。
对测验的信度造成影响的因素主要有：样本团体的性质、测验的长度、测验难度。
⑴样本团体的性质。
样本团体的分数分布：分数分布越广，信度系数就相对越高，分数分布越窄，信度系数就会越低。
样本团体的异质性：取样团体的异质性越大，信度系数就相对越高。
不同团体间能力水平的差异。
⑵测验的长度。
测验越长，信度值越高。一方面，测验越长，题目取样或内容取样就越充分，结果就越可靠。另一方面，较长的测验也不容易受到猜测的影响。
⑶测验的难度。
如果一个测验的难度太低，测验分数会非常集中并聚在高分端，即出现天花板效应，或者难度太大，所有分数都集中在低分端，出现地板效应，都会使测量到的分数分布太窄，导致信度降低。只有当测验的难度水平能够使测验分数分布范围最大时，测验的信度才会比较理想。一般来说，当所有被试的平均分为测验总分的一半，并且分数从零分到满分分布时，测量的信度最高。

人事测量的关键技术：效度

填空及选择
⒈测量的效度就是指测量的有效性，即能测量到所要测量的目标的程度。
⒉效度的性质：效度是连续性的，效度高低只是程度上的差别，它不是“全有”或“全无”的变量。
⒊影响效度的因素：测验的因素、样本团体的性质和效标的性质。
测验的因素：⑴测验题目的质量；⑵实施测验时的干扰因素；⑶被试的影响因素；⑷测验的长度：一般来说，增加测验的长度通常可以提高测验的信度，增加测验的题目往往也能提高测验的效度。测验长度对效度的影响：r(nx)y=nrxy/ n(1-rxx+nrxx)其中，r(nx)y为测验增长到原来的n 倍后，测验(x)与效标(y)的相关（即增长后的效度系数）；n为测验增长的倍数；rxy为原测验的效度系数；rxx为原测验的信度系数，根据公式中以推知，要达到满意的效度水平，测验题目需要增加几倍。
效标的性质：一般来说，如果其他条件相同，所测量的行为或心理特质与效标行为或特质越相似，效度系数就越高。效标与测验分数之间的关系是否线性也是一个很重要的影响因素。如果测验分数与效标之间的关系是非线性的，采有皮尔逊积差相关将会低估相关的大小，造成效度的低估。
名词解释
效度：与测量目标有关的真实分数方差与总分方差的比率。rXY=SV2/SX2其中，rXY为测验效度；SV2为有效方差；SX2为总方差。
简答及论述
⒈信度和效度的关系。
⑴信度主要是指测量结果的可靠性或一致性。
效度：与测量目标有关的真实分数方差与总分方差的比率。rXY=SV2/SX2其中，rXY为测验效度；SV2为有效方差；SX2为总方差。
⑵信度和效度的差别在于所考虑的误差不同。信度考虑的是随机误差的影响；效度的误差则还包括对测验目的来说无关的变量所引起的系统误差。
误差方差低（即信度高）并不保证效度就一定高；但效度高的话，信度必然要高。信度是效度的必要条件。
⒉如何评估人事测量的效度。
效度可以分为内容效度、构想效度和效标关联效度三类。
⑴内容效度是检查测验内容是否是所欲测量的行为领域的代表性取样的指标。如成就测验往往采用内容效度的评估方法。
内容效度分析时要注意两方面问题：
应避免将测验取样的行为领域过于泛化；
要注意测验分数中无关因素的影响。
较好的内容效度依赖于两个条件：
测验内容范围明确；
测验内容的取样有代表性。
效标参照测验应用的基本条件是具备足够的内容效度。
⑵效标关联效度。
也称效标效度，反映的是测验分数与外在标准的相关程度，即测验分数对个体的效标行为表现进行预测的有效性程度。
效标是考察测验效用的外在参照标准。根据效标材料收集的时间不同，可将效标进一步区分为预测效度和同时效度：
预测效度的效标资料往往是测量结束后隔一段时间才获得，它反映的是由测验分数对任一段时间间隔后被试行为表现的预测程度。预测效度适用于那些对人员进行选拔、分类和安置的人事测验，这些测验需要对应试者将来的工作绩效进行可靠的预测。
同时效度的效标材料可以和测验分数差不多同时搜集。有时，同时效度可以替代预测效度。
效标是衡量测验有效性的参照标准，是一种可以直接、独立测量的行为。效标的概念可以细分为观念效标，（即效标的实质概念内容）和效标测量（即效标的具体度量方法）。
效标污染是指由于评定者知道测验分数而影响个人的效标成绩的情形。
常用的效标：学术成就、特殊训练成绩、实际工作表现、团体对照、等级评定（评定可以作为任何测验的效标）和先前有效的测验。
⑶构想效度。
是指测验能够测量到理论上的构想或特质的程度。所谓构想通常指一些抽象的、假设性的概念或特质，如智力、创造力、言语流畅性、焦虑等。这些构想往往无法直接观察，但是每个构想都有其心理上的理论基础和客观现实性，都可以通过各种可观察的材料加以确定。
确定构想效度的步骤：
建立理论框架，以解释被试在测验上的表现；
依据理论框架，推演出各种有关测验成绩的假设；
以逻辑和实证的方法来验证假设，根据这些累积材料决定这种理论是否能恰当地解释现有材料，如果不能作出恰当解释，则应该修正上述假设，直到能作出恰当的解释为止。
常见的确定构想效度的指标：
发展变化；
与其他测验的相关；
因素分析。是分析行为资料内部关系、结构特性的一种统计技术，比较适合于对构想效度的研究。通过因素分析可以找出测验中所包含的特质。
内部一致性。考验内容一致性的方法主要有三种：
考察总分较高和较低两类人在各题目上通过率的大小，比较每个题目上总分最高的27%的被试与总分最低的27%的被试，如果通过率显著大于后者，则认为题目是有效的，否则应淘汰或修改。
计算题目与总分的相关，如未达显著水准，应予淘汰。
求分测验与总分的相关。
会聚效度和区分效度。1960年坎贝尔指出要确定一个测验的构想效度，则该测验不仅应与测量相同特质或构想等理论上有关的变量有高的相关，也应与测量不同特质或构想等理论上不同的变量有低的相关，前者称为会聚效度，后者称为区分效度。
人事测量的关键技术：项目分析

填空及选择
⒈难度分析就是对题目的难度进行估计以确定适宜的难度。
⒉题目难度水平究竟多高合适，依赖于测验的目的、性质和题目形式。
⒊对于是非题而言，其难度值应该为0.75最为合适；而对于四择一题目，其难度约为0.63时最为合适。
⒋就成就测验而言，一般要求项目和总分的相关达到0.2以上，而鉴别度指数希望达到0.15-0.20以上。一般心理测验，D值在0.30以上就可以接受。
名词解释
⒈项目鉴别度是指测验项目对于所测查的心理特性的鉴别能力和区分程度。鉴别度分析可以从项目效度和内部一致性两方面着手。
⒉项目效度分析主要以效标为依据，考察被试在每个试题上的反应与其在效标上表现的相关程度，即每个试题所测查的行为是否反映了被试在效标上的表现。鉴别度分析的指标有相关系数和鉴别度指数两种。
⒊衡量项目鉴别度的简便方法，即鉴别度指数，它是比较效标得分高和得分低的两组被试在项目上通过率上的差值：D=PH-PL
当效标成绩是连续变量时，可从分数分布的两端各选择27%的被试组成高、低分组，再分别计算两组每道题目上各自的通过率，二者之差就是各题目的鉴别度指数D。
⒋有时在进行项目分析时，难以找到合适的效标，这时可以采用测验的总分代替效标，考察每个试题和总分的一致性，即做项目――总分分析。这种分析反映的是测验各项目所测查内容的一致性，而不能反映题目对效标的有效性。
⒌诱答分析是指系统考察测试题目，以诊断题目是否符合一系列测量学要求的过程，主要目的在于避免猜测的影响，使题目真正反映应试者的真实情况。
⒍在设计诱答时，要注意避免两种情况：⑴不要出现过于容易被排除的诱答，这会使不知道正确答案的被试猜测正确的概率提高；⑵不要出现过于似真的选项，即欺骗性诱答。
如果被试掌握了题目所要考察的全部知识仍很难对正确答案与某一诱答进行区分，那么该诱答就是欺骗性诱答。欺骗性诱答的出现使题目实际考察了目标之外的能力，使测验的效度降低。
⒎教育敏感性是指一种教育培训项目能否产生特定效果的可能性程度。选取两组被试（人数相同），一组进行培训，另一组不参加培训。培训结束后，对两组被试施测待分析的测验。计算每个题目的“教育敏感性”指数：s=（RH-RL）/N
简答及论述
⒈论述项目效度与内部一致性的比较。
⑴项目效度分析主要以效标为依据，考察被试在每个试题上的反应与其在效标上表现的相关程度，即每个试题所测查的行为是否反映了被试在效标上的表现。
内部一致性信度系数主要反映的是测验内部题目之间的关系，考察测验的各个题目是否测量了相同的内容或特质。
⑵项目效度代表题目与外在效标的关系，内部一致性则更多地代表题目与总分的关系。有较高的内部一致性的题目，并不一定与外在效标有很高相关。同样，部分具有很高项目效度的题目，与测验总分的相关并不理想。项目效度和内部一致性有时候是有矛盾的。
⑶如果测验是预测性测验，则应该多采用项目效度较高的试题；如果测验要求同质，即希望各个试题都测量同一特质，则应该选择内部一致性较高的题目。有时这两种方法也结合使用。
 人事测量在现实中的应用

填空及选择
⒈人事测量的主要用途：选拔、培训、考核和晋升。
⒉人事测量简化流程：⑴诊断岗位素质需要，制订人－事对应表；⑵确定测评方法、工具；⑶实施测评；⑷鉴定测评效果。
⒊一些常见的素质测量内容：⑴知识：财会、外语、法律、管理、计算机；
⑵技能：打字、设备*作、驾驶、电器维修、书法；
⑶能力：感知力、注意力、记忆力、判断、推理、概括、想象、表达、空间认知、数量分析；
⑷情绪：理解、表达、控制、调节；
⑸需要、动机：生物需要、安全需要、归属需要、尊重需要、独立需要、自我实现需要、成就动机、权力动机、亲和动机、风险意识；
⑹人格：内、外向、才识、情绪稳定、谦逊、严谨、责任心、敢冒风险、理智、随和、现实、坦率、安详自信、保守、自主果断、自律、心气和平、面子意识；
⑺特殊管理能力：沟通能力、管理变革、团队指导、计划、组织协调、指挥控制、预测、决策、管理方式风格、资源利用、有效管理信息、时间分配。
⒋企业人才测评的技术组合形式：⑴针对人事业务目的的组合；⑵针对岗位与职务的组合；⑶针对企业文化的组合。
名词解释
⒈人力资源是指人所具备的能按一定要求（质、量、速度、耐用性）完成一定工作的各种躯体的和心理的素质或准备，包括个体的能力、技能、个性、动机模式、兴趣偏好、价值取向、交际风格及知识等，以及由个体的人构成工作团队乃至整个组织时所产生的整体特性和效力。
⒉综合评价是以岗位对人事的各方面要求为依据，也就是说，是以人－事匹配为原则，进行全面系统的评价。
⒊社会中有许多工作岗位，每一个工作岗位都对任职者的素质有各方面的要求。只有当任职者具备所有这些要求的素质，并达到规定的水平，才能最好地胜任这项工作，获得最大绩效。这种人和岗位的对应关系就是人－事匹配关系。
⒋能力性向就是指一个人的能力结构各方面的组合特征，它使其具有特定的才干、胜任特定的工作。
⒌划销测验即在规定时间里按要求以一定规律划销测验纸上指定的内容，分析不同时间、不同任务要求下作业的成绩（作业量和正确率），以此判定气质特征。
内田－克里佩林测验是一项很简单但很有效用的气质测量工具。
⒍在现实工作中，我们会经常遇到具体的工作能力上的素质，它们本身并不是某种单纯性的素质，而是由多种素质综合而成，故称为综合素质。它们在现实工作中很难被分解，它们只是对应于具体的工作要求，而不是一种理论上的单一素质。
如高层管理者常常需要具备一些综合管理能力，包括计划、组织、预测、决策、沟通等。此外，他们还需要对多方面管理业务的整体运作能力，包括对人、财、物、信息等多方面控制、把握。由于这些素质具有复杂的构造成分，使相应的测量、评价有很大的难度。
简答及论述
⒈组织为什么要进行人事测量？
如果把人当做一种资源，一种资本，一种需要并且能够增值的资本，那么你就会理解为什么要运用人事测量。人力资源作为一种资本也可以运作，你就需要对它有所了解。许多发达工业国家的大企业，都会在不同程序上以一定的方式采用各种类型的人事测量工具，对人力资源进行评价。逻辑原因如下：
⑴企业经营目标是由人来实现的；
⑵为了实现一定的企业经营目标，需要一定的人力资源；
⑶什么样的人力资源能胜任企业目标，需要进行评估。
⒉关键事件法的步骤。
关键事件法是指通过要求任职者回忆过去工作中的一些重大事件、评价正确应付、处理该事件的行为、方法即由此对当事人素质的要求，从而建立岗位素质要求说明的方法。一般有以下几个步骤：
⑴回忆关键事件；⑵界定关键行为和方法；⑶说明采取关键行为和方法所要求的素质；⑷对各种素质内容分配权重。
⒊实施测评的三大要素。
为保证测量数据的可靠性、正确性，必须注意实施过程中的一些因素，具体如下：
⑴现场环境设置：温度、湿度、整洁度、照明、噪音、工作相关性等；
⑵主试态度：温和、支持性、倾向性；
⑶过程控制：标准化。
实施过程有三大要素：现场的物理环境、主试主观态度构成的心理环境、过程的标准化所构成的技术环境。
⒋如何对人事测量进行管理。
对人事测量管理，简单地说，必须严肃、慎重地对待人事测量，不可滥用人事测量，还要对人事测量的结果采取必要的安全措施。
⑴目的管理。
要进行人事测量，首先必须澄清目的，如果目的不清，还会使人事测量面临一系列后果：①无法确定要测量的具体内容；②无法确定要测量的合适对象；③无法确定适宜的测量工具；④无法确定测量结果的评价标准；⑤无法合理、有效利用测量的结果，造成浪费。
⑵技术管理。
从事人力资源管理工作的专职人员应当熟悉人事测量的基本原理、方法。
⑶现场管理。
人事测量是极其严肃的事，必须认真对待。现场环境的布置、预先的通知、协调，测验材料的印刷，答题工具的准备，指导语的形式等。所有这些要素、环节都细心安排，不能疏忽，否则就会引起测量结果的误差，使结果难以解释。
⑷安全管理。
保密性问题涉及两个方面。一是测量工具本身必须保密，不能外传、流失，否则可能使测量失效。另一方面，保密性涉及为被测量者保守个人隐私。
⑸应用管理。
人事测量的结果为人事招聘、选拔、安置提供依据。
⒌论述测评的使用价值。
假定某企业现在要招聘一批人，企业预先设定好了选人的标准。假设应聘人群有40%达标，但事先并不知道谁是达标者。那么，如果要从中选出20%的人，靠随机的方法把握只有8%。但如果有一个哪怕只有0.50效度系数的测验，那么把握就可达到69%，如果靠0.70效度系数的测验，把握可达82%，已经是相当理想了。

 合乎标准的人错误拒绝正确接受
B A
工作绩效标准
D C
不合标准的人正确拒绝错误接受

 测量标准
拒绝接受
椭圆的形状实际上反映了测量结果与真实结果之间的拟合关系，即效度。效度越大，椭圆越扁，越接近斜线，犯B类和C类错误的可能性越小，测量越准确，决策越可靠。需要注意的是，测量标准设定的最佳点是经过椭圆的中心，这时选择正确比率最大。但由于一般来说，我们更关心A的比率尽可能大、C的比率尽可能小，那么，即使效度不很高的情况下，提高测量标准，也可达到提高A的比率、降低C的比率的作用。
基本测验：个性品质测验
简答及论述
⒈卡特尔16种人格因素测验。
⑴人格测验目的与功能。
目的：利用成熟的人格测验方法对管理者或应聘人员的人格类型进行诊断，可为人事安置、调整和合理利用人力资源提供建议。这正是本测验的使用目的所在。
功能：从乐群性、敏锐性、稳定性、影响性、活泼性、规范性、交际性、情感性、怀疑性、想象性、隐秘性、自虑性、变革性、独立性、自律性、紧张性16个相对独立的人格对人进行描绘，并可以了解应试者的环境适应、专业成就和心理健康等方面的表现。
⑵测验的特点：卡特尔16种人格特质测验是自陈量表，对自我进行判断。
⑶适用对象：本测验是评估16岁以上个体人格特征的最普遍使用的工具之一，广泛适用于各类人员，对被试的职业、级别、年龄、性别、文化等方面均无限制。
⑷构成：测验由187道题组成，共有16个分量表。
⑸本测验需要特别注意的事项：
使应试者真实做答；
注意甄别应试者的反应风格，即答题倾向性。对分值描述，是否有答题倾向性，要排除；
注意考察应试者是否有社会赞许性倾向，特别在用于对应聘者的筛选测验中；
如果需要，在本测验中可加入测谎量表，作为监控手段。
⒉DISC个性测验。
⑴测验目的与功能。
目的：DISC个性测验就是一种人格测验，它包括24组描述个性特质的形容词，应试者要根据自己的第一感觉，从每组四个形容词中先出最适合自己和最不适合自己的形容词。
功能：DISC个性测验着重从四个与管理绩效有关的人格特质对人进行描绘，即支配性(D)、影响性(I)、稳定性(S)和服从性(C)，从而了解应试者的管理、领导素质以及情绪稳定性等。
⑵测验的特点：①适合一般、正常的个体；②与管理绩效相关，能很好地描述应试者的个性特征，并能预测其领导特征和情绪稳定性等；③测验时间短，简单易行；④有比较完善的解释体系。
⑶适用对象：大、中学生。大、中学生往往面临升学、就业的选择。
社会上的一般人员。成年人往往对自己的性格特点也不是十分地了解，知道自己性格上的优势、缺点有助于更好地进行工作；
管理人员。选择一些更易与企业形象、企业文化相融合个体，形成企业独特的特征和氛围。
⑷测验的构成：DISC个性测验由24组描述个性特征的形容词构成，每组包含四个形容词，这些形容词是根据支配性(D)、影响性(I)、稳定性(S)和服从性(C)四个测量维度以及一些干扰维度来选择的，要求被试从中选择一个最适合自己和最不适合自己的形容词。
⒊论述：比较以下几种人格测验：MMPI、16PF和DISC。
⑴人格主要是指人所具有的与他人相区别的独特而稳定的思维方式和行为风格。人格同人的工作绩效和工作方式及习惯有关。
⑵明尼苏达多相人格问卷(MMPI)。
建立初衷是要诊断各种类型的精神病和心理疾患。各类患者与正常人区分开来的题目，组合成相应的测验。它对于区分正常人与病人比较灵敏，但并不合适对正常人进行不同目的检测，故而在组织人事选拔中并不常用，也不适合用。
⑶卡特尔16人格因素问卷。
引入统计分析的方面，经过大量计算，发现可用16个因素维量描述所有人的人格面貌，从而建立了16人格因素问卷。16人格因素测验是以正常人为对象，描述各种人在16个人格因素维量上的表现形态，从而描述人的人格结构。相对较多地应用于工商界，不过由于它只是针对普通人建立的人格测验，它基本上适合普通从业者，并不适合中高层管理者。 
⑷DISC人格测验
是一个相当流行的简便易行的人格测验。它把人格分为四大类型，即支配型、交际型、稳妥型、服从型，对每种类型的人又区分出6种亚型。由于它能作出详细的分类，同时又能对每种人的特征、团队价值、所适宜的工作环境等给出较详细的说明，在工商界受到相当欢迎。
⒋管理人员人格测验。
⑴测验的特点：该人格测验是根据“大五”人格模型中五大人格维度（正性情绪倾向、负性情绪倾向、乐群性、责任心、广纳性）及经大量研究证明与管理绩效有关的7项人格维度（内控性、自控性、自信心、A型人格、成就动机、权力动机、面子倾向）构建成的一项个性测验。测验题目以三择一的选择题形式出现。
⑵测验的构成：12个人格维度，分别是正性情绪倾向、负性情绪倾向、乐群性、责任心、广纳性、内控性、自控性、自信心、A型人格、成就动机、权力动机、面子倾向。
 基本测验：职业适应性测验

填空及选择
⒈生活特性问卷是为评定个体的动机水平而编制的。
维度定义： ⑴风险动机；⑵权力动机；⑶亲和动机；⑷成就动机。
⒉需求测试的特点：本测验的设计和建构参照了马斯洛的需要层次理论所提出的五种层次的需求形式，以生理需求、安全需求、爱的需求、自尊的需求、自我实现的需求为维度建构而成。其中生理、安全需要、爱与归属的需要为较低层次的需求，主要靠外在事物来满足；而自尊的需要、自我实现的需要为高层次需求，是自己内在的满足。
⒊职业兴趣测验的特点：霍兰德在研究职业兴趣的共同性和差异性之中找到的六个测查维度：*作取向、研究取向、艺术取向、社交取向、经营取向、事务取向。其理论来源主要基于下面的几个假设：
⑴大部分的人可被归于六种人格类型的一种；
⑵现实社会中存在六种不同的工作环境；
⑶人们倾向于寻找和选择那种有利于他们技术、能力的发挥、能充分表达他们的态度、实现他们的价值、并使自己能扮演满意角色的环境；
⑷一个人的行为是他本人个性和环境特征相互作用的结果；
⑸个体类型和环境类型的一致性、和谐度的程度可由一个六角形模型来解释和评估；
⑹个体内部或环境内部自己的相容性程度也可用一个六角形模型来决定。
⑺个体或者环境的区分度可由职业的编码、所绘的结果剖面图以及两者共同来解释。
名词解释
职业适应性测验主要从个体的需求、动机、兴趣等方面考察人与岗位工作之间的匹配关系。这一类测验了解个体的生活目的、追求或愿望，反映个体对工作的期望，因此对于选拔人员、激励设计等方面很有参考价值。
基本测验：能力测验
简答及论述
⒈多项能力与职业意向咨询。
⑴测验的功能：多项能力与职业意向咨询选取了和社会上大多数职业活动有着密切关系的六个维度进行测评，即语言理解和组织能力、概念类比能力、数学能力、抽象推理能力、空间推理能力、机械推理能力。
⑵测验的特点：能力倾向测验一般指用来测量从事某种职业或活动的潜在能力的评估工具。能力倾向不是特殊训练的结果，它存在于某种特定的训练与学习之前。可以把能力倾向测验分为三类：一般能力倾向测验、特殊能力倾向测验和多因素能力倾向测验。
一般能力和特殊能力。一般能力指通常所说的记忆力、注意力、想象力等，也是人们常说的“智力”。特殊能力指音乐能力、绘画能力等。
⒉数量分析能力测验的功能。
在测验的测查不需要任何特别的专业知识背景，测查内容和范围包括：
⑴对数值、图表的敏感性；
⑵快速的综合分析能力；
⑶一定的快速数字估算能力。
⒊敏感性与沟通能力测验。
⑴测验的特点及维度。
本测验分两部分：敏感性测验与沟通能力测验。敏感性测验测查应试者对人际事物的洞察、分析和预见能力，特别是在认识和把握问题的实质并进行分析处理时敏锐地捕捉人际信息、利用人际关系有效地解决问题的能力；沟通能力测验侧重于对应试者在营销情境中运用人际沟通技巧和策略方面的考察。
⑵测验有以下难度：①敏感性；②沟通行为倾向：开放式沟通倾向、*纵式沟通倾向、非沟通倾向（营销意识）；③营销意识。
基本组织人事调查
填空及选择
⒈调查和测验不同，目的主要是了解某种特征或态度或行为倾向的普遍性或程度或影响性。
⒉个体行为评估：⑴工作感觉评定目的：测查员工对现任工作的满意度，为组织了解员工的工作态度，预测其工作效率和稳定性提供信息。
特点：直接询问员工感受的问卷调查法是最为有效的测量工具。
⑵价值取向评估目的：测查员工在社会、理论、唯美和经济－政治四种价值取向的相对强度。可由此鉴别职业生活志向，评定工作动机。
⒊领导行为评估：沟通方式评定、冲突应付方式评定、工作习惯评定和变革意识评估。
⒋工作习惯评定目的：测查管理者的官僚倾向，是否能接受或偏好严格的制度和规范化模式。
⒌团体行为评估：团队健康度测试和团体绩效评定。

 基于情境的测验

填空及选择
⒈管理者的管理能力主要来自三个方面：自身素质基础、社会实践体验、所掌握的有关知识。
⒉公文筐测验实施的五个维度：工作条理性、计划能力、预测能力、决策能力、沟通能力。
⒊公文筐测验从以下两个角度对管理人员进行测查，一为技能角度，主要考察管理者的计划、预测、决策和沟通能力。一为业务角度，公文筐的材料涉及财务、人事、行政、市场等多方面业务。
⒋在评价中心技术中，用于评估和选拔管理人员的情境模拟测试有两种：⑴小组作业；⑵个人作业。
⒌讨论题的形式：⑴开放式问题；⑵两难问题；⑶多项选择问题；⑷*作性问题；⑸资源争夺问题。
⒍无领导小组讨论的维度定义：⑴组织行为；⑵洞察力，又称智慧能力；⑶倾听；⑷说服力；⑸感染力；⑹团队意识；⑺成熟度。
⒎结构化面试的特点：⑴科学性；⑵双向沟通性。
名词解释
⒈公文筐测验，又叫文件筐测验，是为中、高层管理人员的选拔、考核、培训设计的一项具有较高信度和效度的测评手段，为企业的高层人力资源计划和组织设计提供了科学可靠的信息。也可用于其它行业，如企事业单位的中、高层管理人员。
公文筐测验是一种情境模拟测验，是对实际工作中管理人员掌握和分析资料、处理各种信息以及作出决策的工作活动的一种抽象和集中。测验在假定情境下实施。
⒉无领导小组讨论是指由一组应试者组成一个临时工作小组，讨论给定的问题，并作出决策。由于这个小组是临时拼凑的，并不指定谁是负责人，目的就在于考察应聘者的表现，尤其是看谁会从中脱颖而出，成为自发的领导者。

 简答及论述
⒈什么是测查管理能力的最有效方法？
⑴测查管理能力的最有效方法是评价中心技术，在选用管理人员时，评价其是否具备较好的管理能力。有研究表明，评价中心技术的预测效度在现有各种方法中是最高的。而公文筐测验是评价中心技术的主要工具之一。
⑵评价中心方法是把受评人置于一系列模拟的工作情境中，由企业内部的高级管理人员和外部的心理学家组成评价小组，采用多种评价手段，观察和评价受评人在这些模拟工作活动中的心理与行为，以考察受评人的各项能力或预测其潜能，了解受评者是否胜任某项拟委任的工作以及工作成就的前景，了解其欠缺之处，以确定重点培训的内容和方法。
⑶评价中心技术的主要评价手段包括：诊断性面谈、投射测验、纸笔测验、小组问题解决、无领导小组讨论、角色扮演法以及公文筐测验。
⒉如何看待结构化面试的结构性？
⑴面试考核要素结构化，并作为评分标准的基础。
⑵面试试题（内容、种类、编制）的结构化，不同类型的题目与测评要素相对应。
⑶评分标准结构化（要素得分、所占比重、总分、考官评语、与其他测评工具的得分的合成，有一定比率）。
考官使用的评分工具包括个人评分表和得分平衡评分表。评分内容：测评指标、水平刻度、测评规划。
⑷组建面试考官、监督员及考务人员队伍结构化。面试小组由5-9人组成，设有主考官、副主考官、监督员及考务人员等。
⑸选择与布置考场结构化。
⑹具体*作步骤结构化。
⒊结构化面试实施应具备的基本功能。
⑴区分功能：在一定程度上能够区分出应试者的相对差异，依据量化结果可做参照和比较；
⑵评定功能：是否达到了规定的某标准；
⑶预测功能：预测应试者在未来岗位上的表现、成功的可能性和成就。
⒋结构化面试方案的构成。
本面试方案共由五部分材料构成，分别为《人员甄选中面试的技术规范》、《面试考核要素重要性及具体标准分析表》、《规范性问题设计》、《个人评分表》、《得分平衡表》。
 面向高绩效管理的测验

填空及选择
⒈“面向高绩效管理的测验”共包括10 项工具。⑴人际敏感能力测验；⑵管理变革测验；⑶团队指导技能测验；⑷自我实现测验；⑸人际关系管理测验；⑹沟通技能测验；⑺XYZ管理方式测验；⑻基本管理风格测验；⑼管理情境技巧测验；⑽组织绩效测验。
⒉基本管理风格测验把管理行为在两个维量上展开分析：工作取向和关系取向。
 高关系低工作高关系高工作
关关系式 关系式
系
取 低关系低工作高工作低关系
向分离式 治业式
 工作取向
简答及论述
⒈XYZ管理方式测验.
⑴X假定。认为人类基本上是动物性的，是一种被文明所控制的动物，它生来是邪恶的，是由生物冲动所驱使的，是为了追求金钱和物质满足而生存的，它的基本交往模式是竞争。典型的表现是认为：
人类喜欢竞争；
提高绩效的唯一办法是提高报酬；
政府的基本职能是控制、约束。
⑵Y假定。认为人类的本性基本上是寻求自我实现，他们不需要什么控制、约束而能卓越地工作，人的本性是善的，是由人性所驱使的，它的基本交往模式是合作。这一假定的典型表现是认为：
人喜欢与别人合作；
绝大多数人是相互信任；
政府的真正职能是帮助社会。
⑶Z假定。认为人类的本性基本上是理性的，它寻求理性并由理性所约束。人生来既不是善的，也不是恶的，而是可能在后天影响下成为善的或恶的。人是由智慧所驱使的，它的基本交往模式是独立。典型表现是认为：
理解人的最佳方式是把人看做是理性的；
人是按照他们认为应该做的事去行为的；
让人从事某种工作的最佳方法是清楚地说明工作的内容、方法、意义等所有方面。

 人事测量工具的组合原理

填空及选择
任何一个完善的人事测量系统，应该具备两种功能：⑴提供足够数量的、满足实用选择的工具。这是人事测量系统的基本功能，那种靠少数几种工具“不变应万变”的做法是不可取的；⑵提供如何组合各种测量工具的技术。这是人事测量系统的高级功能。
简答及论述
⒈测量工具的组合设计一般程序。
测量工具的组合设计一般包括七个步骤：确定考评目的、需求分析、确定测量手段、预期结构、实施过程的设计、考评时间、费用预算或报价。
⑴确定考评目的。
确立考评目的是人事测量的开端。从大处讲要参考社会、市场、经济形势的发展状况，结合企业的长远发展战略、企业的文化追求。如日本的TOTO有追求卓越的理念，在招聘时希望自己的员工有精益求精的品质。从小处讲，考评目的的确立要结合企业的经营策划、组织策划、变革策划。要结合具体的人事管理目的和人力资源开发需要。
⑵需求分析。
需求分析建立在对施行人事测量的企业有全面、深入的认识基础上。如要了解公司的规模、性质、管理体制、经营理念、企业文化等方面的情况。
要求人员素质的考评要素必须反映：①企业文化和理念的要求；②岗位工作的要求；③岗位职责的要求；④个人可发展性的要求；⑤适应性要求。
从内容上看，考评要素包括：①个性品质；②职业适应性（如兴趣取向、价值取向、需求与动机水平）；③技能与能力：资格认证水平（如专业技能水平，外语、计算机应用水平等）、基本能力（如智力水平）、职业能力（如营销技能）、管理技能（如计划、预测、决策、沟通能力）。
⑶确定测量手段。
在每选择一个具体的工具时，要说明这个测量工具的功能，采用的理由。在选择测量工具时，必须考虑到企业的特色与文化。
⑷预期结果。
预期包括几个方面的内容：①由具体的分数如何建立综合报告；②测量的结果将如何指导后期的工作；③可能在更大范围中对员工产生的影响；
⑸实施过程的设计。
把实施所有测量的具体程序确定下来，包括说明有关时间、地点、辅助材料、现场布置要求、分组（如果需要的话）、设备、流程等所有细节工作的安排、落实。各个测量之间要有充分的休息。
⑹考评时间。
测量组合设计时要考虑和说明测量项目的时间。
⑺费用预算或报价。
在完成一个人事测量的设计时，要给出它的预算（对组织内部而言）或报价（就组织外部而言）。
以上七步骤的设计落实在文字上，就构成了人事测量计划书，可用于项目申请、服务业务洽谈等。
⒉实施过程的设计应考虑的原则。
⑴简便易行的测量放在前面（但有时为了充分利用上、下午的时间，也会按时间段的长短调整顺序）。
⑵成本低的测量放在前面。
⑶当一个测量的内容可能影响（如暗示、帮助）其他测量时，这个测量应放在后面。
⑷容易产生疲劳的测量放在后面。
⑸测量内容比较敏感，或容易造成较大压力的测验（如能力测验）应放在后面。
⒊论证技巧。
在构思和计划书的写作中应注意以下几点：
⑴要紧扣目的；
⑵要有逻辑性，体现合理性；
⑶结合企业的经营理念、文化追求来论证，体现“量体裁衣”的设计品位；
⑷充分肯定企业／客户需求的重要性、迫切性和正当性，在认识上体现共识。
⒋组合的原则。
⑴以满足企业／客户的需求为目的，充分体现对该需求的呼应；
⑵以工作分析为基础，突出重点，全面考评；
⑶以对企业或职位来说十分关键的素质作为评估重点，考虑经济原则；
⑷以能力、个性评估、职业适应性（动机、需求、兴趣）三大模块为基本测评内容。
针对不同管理目的的人事测量
填空及选择
⒈培训与开发是人力资源管理的基本核心。
⒉培训与开发的需求分析包括三个方面：组织的需求分析、工作任务的需求分析和人员的需求分析。
⒊基层主管人员的晋升选拨：重要品质：管理意识、智力、分析能力、信息沟通能力和正直。
⒋人事考核的概念从内涵上说是对人或事的评价，有两层含义：⑴对人及其工作现状进行评价；⑵对人的工作结果，即人在组织中的相对价值或贡献程度进行评价。
⒌用于考核的心理测验设计原则：多项能力测验、管理数量分析能力测验、管理逻辑推理能力测验、公文筐测验、小组讨论和面向高绩效的管理潜能开发测验。
⒍用于激励的测验常用的工具包括：动机测验、价值取向测验、需求模式调查、工作满意度调查和激励因素调查。
 简答及论述
⒈一个有效的甄选录用程序必须符合的特征。
⑴甄选录用程序是标准化的，每位通过同一岗位甄选系统的应聘者都经历同样数量和类型的选拨程序。
⑵甄选录用系统以有效的顺序排列各种程序。花费较多的程序要作为系统的最后程序，只用于那些最可能被录用的求职人员。
⑶甄选录用系统能提供明确的、客观可靠的决策点。关于求职者通过这些决策所具备的资格以及他们能否在评价系统中继续走下去，管理者有着共同的标准。
⑷甄选录用系统能保证充分容纳确定求职者是否胜任工作所必需的信息。
⑸甄选录用系统可防止在了解求职者背景情况时出现预料之外的重复。
⑹甄选录用系统能更突出求职者背景情况中的最重要的方面。
⒉用于人员选拨的测验组织原则。
对人员选拨有两种策略：一是择优策略，指尽可能全面地了解所有应聘人员的情况，从能力、性格、动机、兴趣等各个角度和层次上做广泛测查，依据职位要求综合性地评估个人的优势水平、与职位要求的匹配程度，从中选择综合优势最好的人员。另一是劣汰策略，指依据职位的要求定出从业人员所必须具备的能力的基线水平，通过能力测验筛除掉能力达不到基本要求的人员。那些通过劣汰测验的人员，并非都能胜任职位的要求。
采用择优策略，在测验设计上往往要求全面、详细，能力测验、个性测验和职业适应性测验都要使用，并且对应不同的职位要考察的内容侧重点不同，从而各测验维量的权重关系不同。
采用劣汰策略，在测验设计上要求准确、适度，往往以能力测验或专业知识和职业技能考试为主。
⒊人事测量工具应用程序是如何进行*作的？
人事测量工具具有客观性，有诊断和预测两大功能，利用测评技术建立晋升考评体系是可行的。应用程序如下：
⑴按岗位进行深入的工作分析，比较原有职位要求与晋升职位要求的差别，包括所需的知识、技能和经验的规定性，依据这些差别确定具体的考察内容，设定量化的晋升标准。
⑵针对考查内容选取与之相关、敏感、可靠的预测因子（如个性、能力、兴趣等），将能够测量出个体在这些因子上的水平的测量工具作为考评手段，并构成组织设计。
⑶实施考评。有条件的话，不仅要求候选人接受考评，而且对现已在他们未来的职位所属管理层的人员也参与测试。这属于基础性的工作，通过测试不仅可以对候选人排序，而且能够了解候选人与其目标层人员的差异程度，这将提供后续指导和训练的线索。
⒋人事考核的内容及关系如何？
⑴成绩考核与业绩考核。
成绩或业绩考核就是考核组织成员对组织的贡献，或者对组织成员的价值进行评价。
对于一个企业经营者来说，希望每一个员工的行为能够有助于企业经营目标的实现，为企业作贡献。这就需要对每个员工的成绩、业绩进行考核，并通过考核掌握员工对企业贡献的大小、价值的大小。
对每一个员工来说，企业至少是自己谋生的场所和手段，希望自己的成绩和业绩被考核所评价，以便自己的贡献得到企业领导的承认。
⑵能力考核。
能力考核是考核员工在职务工作中发挥出来的能力，考核员工在职务工作过程中显示出来的能力，诸如某员工在工作中的判断是否正确、迅速，协调关系如何等，依据他们在工作中表现出来的能力，参照标准或要求，确定他的能力发挥得如何等，作出评定。
针对不同对象的人事测量
填空及选择
⒈一个组织有其不同的层次结构，包括个体层次、团体层次和整个的组织层次。针对不同层次的人事测量方案可能有所差别。
⒉个人测评的内容一般包括能力、个性特征和个性倾向类测验。
⑴能力结构诊断：依据其职业背景和兴趣，可考虑选择沟通能力测验、逻辑推理测验、公文筐测验和小组讨论。
⑵个性特征描述：通过个性测验可帮助个人全面把握个性上的突出特点、风格，正确认识个人的影响作用，调整自己在组织团队中的定位，实现个人性格与职业、与团队的良好摩合。
⑶个性倾向定位。与个性一样，个人的兴趣取向、动机需求模式、价值观取向等，也影响着个人的态度、职业满意度、职业专注程度，最终影响个人潜力的发挥。
⒊应试人员可能有高社会赞许倾向，表现出假饰行为，在测验设计、实施和结果分析中要注意监控和鉴别这种倾向。具体方法：
⑴选用低表面效度的测验，比如能力测验、行为模拟；
⑵选用有可相互参照检验的维量的测验，比如职业兴趣测验和价值观取向测验配合使用，个性测验和动机需求测验配合使用；
⑶在测验指导语中加入必要的解释，消除应试者的顾虑，强调真实做答的必要性；
⑷人事测量实施者应以客观的第三方角色出现，要求应试者的重要关系人回避；
⑸在结果分析中，检查应试者的卷面做答和相关维量上的得分情况，分析应试者对同一表述或问题的反映的一致性和合理性；
⑹如有测谎分数，注意参照。
⒋有一类测量是专门用于团队的，它们一般都十分短小、简洁，而且由于是针对团队而不是一个人，作答的掩饰低，反应真实、可靠。这些工具包括：团队健康度测验、团队绩效评估和团体凝聚力测量。
⒌组织层次的测量常见的调查工具有：工作满意度调查、工作价值观调查和激励因素调查。
⑴工作满意度调查是一些企业特别西方工业发达国家企业经常实施的测量。这个调查旨在了解各层面员工对工作各方面的满意度，涉及内容包括对工作本身的看法，对工作待遇的看法，对上司的看法，对同事的感受等。
⑵工作价值观调查是对员工的价值取向进行考察，具体内容涉及理论取向、唯美取向、社交取向、宗教取向、政治取向、经济取向等方面。
目的和作用：①企业组织考察工作价值取向，主要用意在于为企业文化建设获取第一手材料；②工作价值取向调查也为企业文化的策略提供参考。
⑶激励因素调查：组织必须了解究竟什么因素可能会激励员工。这个问题被转化为考察员工对什么感兴趣、需要什么、什么使他们满意和不满意。
⒍人事测量针对于一般员工的测评侧重点不仅在于能力，也在于员工的心态，比如工作满意度、员工的需求和动机。
⒎中层管理人员所肩负的责任是多元化的，既强调职务技能和经验，又必须有才能实现管理职能。总而言之，中层管理人员所需要的品质是多种多样：
有身体的（健康、精力充沛、风度）；
智力的（理解与学习能力、判断力、思维活跃、适应能力）；
精神的（干劲、坚定、乐于负责、首创精神、忠诚、机智、庄重）；
技术的（职务所特有的知识和技能）；
经验的（由工作本身产生的）。
所有这些品质可分别归为能力、个性特征、动力适应性（个性倾向性）、知识经验四大模块。
⒏高层管理者所具备的素质：一般智力水平、工商管理能力、创造性思维能力、较高的成就动机、灵活机敏但有原则、坚韧的毅力、敏感性与沟通能力及开放和变革意识。
⒐对高层管理者可考虑选择使用的测验：⑴情境模拟测验：公文筐测验和无领导小组讨论；⑵动机调查；⑶个性评估：管理人员人格测验和DISC个性测验；⑷领导行为评估系列测验；⑸管理潜能开发系列测验。
⒑企业组织的基本运作单位包括生产（创造可使用的东西或增加商品和服务效用）、营销（寻找和吸引愿意按价格购买商品和接受服务的顾客或建立分销渠道）、财务（收支、保管和运筹企业资金），以及行政人事（安排人力资源并完成各部门之间以及内外部的必要协调）。
名词解释
假饰行为：高社会赞许性。
简答及论述
⒈针对中层管理人员的人事测量工具组合。
⑴能力方面：
采用管理人员数量分析能力测验和管理人员逻辑推理测验，通过评估应试者对商务图表资料的快速分析能力、对数量关系的敏锐判断和估算能力、对语言逻辑的分析能力，可了解其思维灵活性和严密性、理解能力和判断能力。
采用无领导小组讨论这一情境模拟测验技术，综合评价其组织协调能力、领导意识、成熟度、风度、口才、思维敏锐度；还可以考察能力以外的要素，如团队合作、人际感染力、情绪控制力等，可对管理能力、行为进行有效评价和对未来绩效进行有效预测。
采用领导行为评估中的沟通方式评定、冲突应付方式评定等工具，可以了解管理者的上下沟通能力和策略。
⑵个性方面：
采用管理人员人格测验，评估应试者的个性特征、思维风格和行为特点，可预测其管理绩效。
采用16PF人格测验，在了解其性格概貌的基础上，可进一步评估其情绪稳定性、情绪控制能力和心理健康水平，还可以了解其创造性品质、适应力和事务管理能力。
采用DISC测验可提供针对应试者本人如何扬长避短，提高管理绩效的良好的建议。
⑶兴趣、动机适应性方面：
职业兴趣测验和价值取向评定都可反映个性倾向方面的一些特性，这些特性具有直接的行为指向性，因此具有动力倾向。个人动机模式调查可鲜明地描述个人的行为目的取向。
⑷知识经验方面：
一方面，从职务所需要的知识或技能出发，考察掌握知识的水平。另一方面可通过管理人员的履历了解其受教育程度、专业技术职称水平、是否获得技能等级证书、资格证书等，以及他在以往工作经历中曾担任什么职位。
⒉各岗位系列所要求的基本素质。
⑴生产岗位系列基本素质要求。
能力：时间管理（有时间概念，讲效率，严格保证生产进度）、有效的控制力、系统全面的计划能力；
个性：认真、负责、准确；
知识经验和技能：专业水平高，熟悉生产流程和相关设施，具备安全生产知识。
⑵营销岗位系列基本素质要求。
能力：良好的沟通、协商、应变能力和人际能力，适应力强，富有创造性，情绪控制能力；
个性：乐群、热情、耐心、坚韧执着，能承受挫折感，健谈；
知识经验和技能：最好有客户关系，熟悉分销渠道，具备营销常识。
⑶财务岗位系列基本素质要求。
能力：判断力、决策力，金融预测能力；
个性：细心、严谨、准确，为人谨慎、有序、负责、原则性强；
知识经验和技能：有专业资格认证、经验越丰富越好。
⑷行政人事岗位系列基本素质要求。
能力：人际沟通能力、适应能力，全面细致的分析能力；
个性：随和、热情、友善、令人信赖，细致耐心；
知识经验和技能：熟悉有关劳动法规，具有相关工作经验。
⑸技术岗位系列基本素质要求。
能力：独创性，发现和解决问题的能力，思维严密善于学习；
个性：自信、创造性、追求自我实现，专注于技术进步，最好具有研究价值取向；
知识经验和技能：技术等级认证，相应技术领域工作经验，研究开发的理论技术成果。
针对企业特征和需求的人事测量
不同行业特殊需求及相应测量工具
行业需求分析测验类型生产制造业全面严格的质量控制力创新开发能力个性测验服务产业适于服务取向的个性、兴趣人际技能个性测验人际技能测验文化产业创造性思维高超的组织策划能力综合能力思维测验管理能力测验案例分析 高新技术产业独创性学习能力科技敏感力高新技术造诣敏锐的信息把握和驾驭能力思维测验情境模拟测验案例分析

renli1984 · 发表于 2006-9-12 17:54:15

楼主辛苦了，谢谢拉

		自动登录	找回密码
密码			注册

北京大学人事测量串讲笔记

相关帖子