一、心理测验定义
有关心理测验定义的说法很多,这里提出一个简短的定义:心理测验是在标准的情境下,取出个人行为样本来进行分析和描述的一种方法。现解释如下:
(一)行为样本
所谓行为,系指个人的认识过程(包括感知、智力和记忆等)和个性等。测验研究不同于系统观察,只能做取样研究。行为样意义,正同对水文、空气和人体血液等进行物理化学分析时的取样研究一样,取部分代表全体。取样研究的有效与否,关键在于样本的代表性。不是任何部分都可代表全体。所谓行为样本,是指有代表性的样本,即根据某些条件所取得的标准样本。由于所取到的标准样本只是代表某些心理功能,并不能反映这种功能的全部,所以总不免有某种程度的偏差。因此要通盘考虑样本的有效性、有限性和偏离度。只有在全部了解行为样本意义以后,才能正确使用心理测验。
(二)标准情境
从测验方法所引起的情景来看,要求对所有受试者均用同样的刺激方法来引起他们的反应;从受试者的心理状态来看,要求处于最能表现所要观察分析上的心理现象的最佳时期。
(三)结果描述
心理测验的结果,一定需要加以描述,才能使人们理解,才有意义。描述方法很多,大体可分为两类:数量化和划分范畴。例如,智力商数(intelligence quotient IQ)为单位,对智力行为进行数量化,用记忆商数、损伤指数分别对记忆能力和神经心理行为损伤的程度进行数量化描述。有的心理品质不便数量化,就划分范畴。当然,可数量化的也可以划分范畴。例如,个性测验结果以内向或外向表示。智力划分为正常、超常和低下。这些均属划分范畴。
各种数量化的特殊量数或范畴名称均有一定的涵义,成为测验学的专门术语,并表示测验结果的意义。
二、心理测验的类别
心理测验数目很多,据统计,以英语发表的测验已达5,000余种。其中,有许多因过时而废弃不用;有许多本来就流传不广,鲜为人知;有一部分测验因应用广泛,有的还经过一再修订,并为许多国家译制使用。在1985年出版的《心理测验年鉴》第九版(MMY-9)中收录了1,409个测验。其数量之多,显然不能被每一位临床心理学家都能全部掌握的。大多数都是知道多种。精通少数。有的测验虽然古老一点,但由于个人对它有特殊的经验,就喜欢继续使用。例如:韦克斯勒(Wechsler)量表,第一代的量表是W-B1(1939),1955年修订成WAIS,1981年再修订成WAIS-R。有名的神经心理学家Reitan在他的实验室至今仍沿用W-B1。
心理测验数目多,为了叙述方便起见,按如下一些标准来分类:
(一)以沟通方式来分
可分为言语测验和非言语(或称操作)测验两大类。
1.言语测验 它以言语来提出刺激,受试者用言语作出反应。主要用言语进行主试和被试者之间的沟通。大部分心理测验都属于这一类。但有时同一测验(或量表)中可能包括言语和非言语两部分。言语分口头的和书面的。用口头报告或书写方式来进行沟通,均属于这一类。有一类“纸笔测验”,如果是采用书写的方式,也可以归为此类。在临床上使用言语测验,可以了解受试者以言语为中介的智力、记忆等。人们在正常状况下,智力和记忆有言语或操作方面的优势,在不同的病理情况下,可发生选择性损害。还有一些有肢体残废而言语无困难的病人只能进行言语测验。
2.操作测验 操作是以身体行为来进行沟通,如用动作、表情来进行反应。在这一类测验中,主试者呈现刺激不全是操作的,也可以用言语。但受试者的反应必定是操作性的。因为有些情况不能用言语测验,有时又需要了解操作能力,所以设计这一类测验。
但有时两类测验常常结合使用。例如比奈量表(Binet scale)开始主要是言语测验。但以后修订的期坦福-比奈量表(Stanford-Binet scale),特别是最近的修订本则增加了操作测验成份。古典的甲种陆军测验全属言语测验,而乙种陆军测验则全是操作的。Wechsler的三套智力量表(即成人、儿童和幼儿)每套均分成言语的和操作的两类测验。
(二)以测验材料的严谨程度来分,可分为有结构的和无结构的两类
1.有结构的测验 这一类测验占绝大多数。凡是测验中提出的刺激词句、图形等意义明确,只需受试者直接理解,无需发挥想象力来猜测、遐想的,都是有结构的测验,否则,便是无结构的。几乎所有的能力测验(如智力、记忆、特殊才能以及成就测验等)都为有结构测验。
例如:“词汇测验”,提出一些词汇,要求受试者下定义。这些词汇都是常见的,受试者听得懂,只在理解意义的广度和深度上不同人有区别。“图-词测验”:在提呈一种状态(如器泣)后,要求受试者在几张不同表情的人物画面中选择一个与这种状态相符合的画面(如一张有器泣表情有的脸)。这里提呈的刺激语义明确,提呈的人物画面表情清楚,所以都属于有结构的。
2.无结构的测验 又称投身测验。提呈的刺激无严谨结构。例如:一句未完成的句子,一幅模糊的墨迹图,或主题不清楚的图画。这些均称无结构,或者说,结构不严谨。受试者作出反应时,一定要凭自己的想象来加以填补,使之有结构,使之成为有意义。在这过程中,恰好投射出受试者的思想、感情和经验。所以又称投射测验。历代许多临床家都曾用这类测验去发现病人的内心矛盾和个人的特殊经验。近来,有些普通心理学家利用其中的某些测验(如洛夏测验)来研究个性,发现在研究人格类型时,它比有结构的问卷方法更有其独特用处。无结构测验种类较少,具代表性的有如下几种:墨迹测验(如洛夏测验)、主题统觉测验(TAT)、自由联想测验和填句测验等。
(三)按一次测验的人数来分,有个别测验和团体测验两类
1.个别测验 一次一个被试。临床上主要采用这种测验。如比奈量表,韦克期勒量表,H.R.成套神经心理测验(H.R.B)等。
2.团体测验 一次多个被试,可以多到几十人。可以一个主试,也可以多个主试。其优点在于,可以在较短时间内完成许多人的测验。缺点是不宜个别观察,所以临床上很少应用,而多用于教育、社会学、军事心理等方面。心理测验史上有名的陆军甲种和乙种测验、教育上的成就测验都是团体测验。团体测验可以个别进行。如艾森克个性问卷(EPQ),16项人格因素(16PF),明尼苏达多项人格调查表(MMPI)等。除非将某些方法作出改变,否则个别测验不能采用团体方法进行。
(四)按测验目的性质来分,可分出多类测验
在医学上常用的有能力测验、人格测验、神经心理测验以及行为和症状评定量表。
1.能力测验 包括智力测验、发展量表和特殊才能测验等,成为心理测验的一个重要门类。
智力测验在临床上用途很广,不仅在研究智力水平,而且在研究其同理情况(如神经心理)时都是不可缺少的工具。
儿童发展量表也与智力有关。但因婴儿、幼儿智力正在发育期,可以观察到的主要还是一些本能以及一些初级的智力活动。不到一定的年龄(如5~6岁以后)时所观察到的心理发展指标,与以后的智力水平相关度不会太高。但有许多影响智力发展的疾病,又必须早期进行治疗,才能减少或消除对智力发展的危害,所以要对智力发展水平尽早作出诊断。因此,研究者们不断改进,试图做出智力诊断发展量表。如Bayley婴儿发展量表,Cattell婴儿智力量表和Gesell的发展量表行等都有一定的应用价值。
特殊才能测验:这类测验多为升学、职业指导以及一些特殊工种人员的筛选所用。常用的如音乐、美术、机械技巧,以及文书才能测验。这些测验在临床上应用的较少。
2.人格测验 这是心理测验中的另一个大门类。但以成就(指种类和解决实际问题的能力)而言,不及能力测验。属这类测验的多属自陈量表,即由受试者自己报告的一种客观调查表。几个广泛使用的自陈问卷(或调查目录),如16PF,EPQ,加州心理调查表(CPI)、爱德华个人偏好调查(EPPS)等。在解决实际问题的效用方面都不能与现代的一些智力测验相比。通常将MMPI归为人格测验。因为它测查的是病理人格,所以在临床上得到广泛应用,而普通心理学家用的较少。洛夏测验则首先用于临床,近来多为普通心理学家用于人格研究。
3.神经心理测验 为近30年成长起来的心理测验中的一个分支。它的任务是研究脑与行为的关系。测量不同部位和性质的脑损害时,所损害的特征性心理功能,为临床家的诊断、治疗及预后果提供依据。有名的成套神经心理测验如H.R.B.,L-N成套测验(L.N.B.)等。
4.适应行为评定量表 评定量表是从心理计量学(psychometric)中衍生出来的,具有心理测验的基本特征。其内容以智力为主,并联系到社会性方面。从适应的意义来看,一是指个体有效地应对(cope with);另一是顺应(adjust to )自然和社会环境。在自然和社会环境中,一是需要自己独立生活和维持自己的生命;二是能满足个人和社会所提出的文化要求。所以适应行为包括多方面的因素,如;智慧、情感、动机、社会、运动等以及其他一些尚未知名的因素。适应行为往往不是智力测验所能检查清楚的,因此应设立独立成类的专门量表。例如,知力低下的定义是IQ低下和适应行为受损。所以在诊断智力低下和确定低下等级时,除了依靠智力测验外,另一同等重要的工具便是适应行为量表。现在已有一些用途很广的量表,如Vineland,社会成就量表(VSMS),AAMD(美国智力低下协会)适应行为量表,我国所编制的“成人智残残评定量表”等。
5.精神病学评定量表 为另一大门类的评定量表。其目的是评定精神病症状。为精神病临床家、临床心理学家以及精神科其他专业人员所使用。这类量表数量很多,用途很广,发展之快超过了前面所述各种心理测验。精神病学的研究几乎是量表化了。由于采用微型电子计算机,在使用上更加简便,分析上迅速且准确。有一些量表国际通用。我国目前常用的有如下一些:90项症状量表(SCL-90),Hamiltom的焦虑量表,Hamiltom忧郁量表,Beck的忧郁量表等。