经典好看的实验心理学在线阅读-第70部分-破晓小说

上测量丁你的智力之后下午又重测了，那么任何的变化都可以被假
定为是由测量误差引起的而不是智力上的真正变化。）使用这个假
设，研究者就能够估算测量误差，并试着去提高和详细说明测量仪器
的信度。那么有关量的稳定性问题，本例中指智力，就能够被回
答了。
　　我们先来回顾一些测验发展者用来评估他们的测量信度的技
术。然后再回顾一个多年来尝试着确定智力稳定性的研究。
　　测验信度
　　起初我们注意到，智力的概念并没有从理论上被很好地定义。
一些理论家假定了许多独立的心理能力，或许已超过了100种
（Guilford；　1967）。另一些人则相信，存在一个基本的心理能力和其
M，
∥润
雕圆
n质
h芷日
黠
吧文
船圉
。频
坞视
81
g程
几千
。主
班川
他业
M专
g理
式心
方学
系大
联范
久师
水京
臻●
芸荐
芸推
　　　　：㈣：　747883097　TL。　028　8194　2202日址：http：　i1747883097　qzone　qq　
428虞喜翠嚣磊黩享勰霉
　　　　，理学专业20门主干课程DS视频图文并茂，音质圆润，提供试看　　期待咨询
　　　　／实验心理学
r1
u
他被分离出来的许多具体能力，但这些具体能力不及基本能力重要
（Herrnsteiri和Murray，1995）。这个基本能力被描述为“一种抽象
推理和问题解决的能力”（Jensen，1969，p．19）。为了对它进行测
验，我们集合了许多问题或任务并呈现给个体，同时要求他们在一个
给定的时间内解决。把每个个体的分数与其他人的进行比较，在完
全相信这些分数之前，我们还需要知道它们的信度。如果我们在第
二天或一周后再测验他们，还会得到同样的分数吗？由于我们不相
信在如此短的时间内这个根本能力会发生明显的变化，因此，如果出
现了测验分数的大变化，我们就可以归结为测量误差，这也说明我们368
的测验没有信度。在一个短时期内相继给出两次同样的测验以确定
一个测量的被称之为测验一再测信度的东西。它通常以对大样本被
试的第一次和第二次测验分数之间的相关来表示。
　　　　一个略有差别的程序可以避免诸如特殊的练习效应乏类的问
题。这个技术需要在两次施测中提供一个该测验的预备或平行形
式。如果此时两次测验分数的相关仍然很高，那么就证明了测验信
度是存在的。而且，该测验的两种形式是否等值也可以以这种方式
来确定。
　　第三个计算信度的程序是通过呈现一个单独的测验来进行的。
这个技术提供了分半信度，它把同一个测验的项目随意地分成两组
（诸如序号为奇数的一组和序号为偶数的一组）并计算在该测验两个
半组上得分的相关。如果相关高，则说明测验信度确实存在。此外，
测验项目之间的等值也被确立了。
　　　　智力铡■的稳定性
　　　　通常能在现代的智力测验中发现很高的测验一再测信度（大约
0。　95的相关）。如果我们把这些测验看作是有信度的，那么我们就
能进一步问：个体被测量到的智力终其一生的稳定性如何。有许多
纵向研究已经开始探讨这个问题了，并且大约每十年总有一些报告
发表以便于当代人了解。一个研究报告（Kangas和Bradway，
1971）包括了不同时间在同一组被试身上进行的测验结果。其测验
的具体时间是：被试的平均年龄只有4岁多的1931年时首次进行的
斯坦福一比纳测验，以及后来的1941年、1956年和1969年进行的重
测。最初的样本是由旧金山海湾地区的儿童组成，他们是斯坦福一比
纳量表修订时所需要的全国标准化群体中的一部分。研究中运用了
两种形式的测验。在1941年，用同一个量表对138名被试进行了再
测；在1956年，IlI名被试受到了韦克斯勒成人智力量表和斯坦福一
比纳测验的再测。在1969年，只剩下48名被试同意被再谟l。
　　　　在探讨这个研究的结果之前，我们应该知道它们只能代表那些
被收集数据的被试群。当然，它们也将代表与上述被试类似的群体。
它们可能会也可能不会代表在重要方面与上述被试不同的群体。
　　　　坎加斯（Kangas）和布雷德韦（Bradway）提供的数据表明，在
1969年所测的48名被试与1956年施测的111名被试没有什么差
异。他们提供了两个年段的平均数和标准差以及每个年龄的斯坦
福一比纳测验的IQ值，并发现这两个样本之间没有差异。
　　　　作者还对分数之间进行了配对相关的计算，其中1931年取的是
两个平行铡验值的平均数。在每个年龄都使用了斯坦福一比纳（S…B）
智力测验，而在1956年相1　969年还使用了韦克斯勒成人智力量表
（WAIS）。结果列在表12…1中。注意：WAIS包含一个言语部分和
一个作业部分，两部分的分数放在一起才能得到完整的分数。当你
从左往右看这个表时，你能看到，随着测验阃隔时间的增大，系列测369
验之间的相关减小。当计算平均年龄为4。1岁的学前儿童智力与其
他分数（表的最上边）之间的相关时，这种减小尤其明显。当计算成
人的相关时，它们的系数就要大得多。但是，所有表12…1中列出的
相关都具有统计上的显著性；因此可以说儿童4岁时测出的分数能
够在某种程度上（0。　41的相关）预测他们将来，哪怕是41；　6岁时的
情况。（我们应该也注意到，给4岁儿童施测的智力测验在问题的类
型上与年长儿童有很大的不同；这可能有助于解释他们之间的低相
关。）
　　　　当从表的上部看到底部时，你可以看得出随着被试年龄的增长
1969年的测量值与前几年之间相关的增大。当只用S…B分数而
册1
　4　1
＼、广
　　骊
　　嚣瓣
　　箬
　　∥润
　　雕圆
　　n质
　　h芷日
　　黠
　　吧文
　　船圉
　　。频
　　坞视
　　81
　　g程
几千
。主
班川
他业
M专
g理
式心
方学
系大
联范
久师
水京
撬●
芸推
　　　　：㈣：　747883097　TL：　028　8194　2202日址：http：　i1747883097　qzone　qq…
430蓐喜翠曩票磊薯类享惑登霉
　　　　，理学专业20门主干课程DS视频图文并茂，音质圆润，提供试看　　期待咨询
　　　　／实验心理学
表n…i　1931…1~69年期问四个年龄的IQ谢验舟教之间的相关
测　　验
1941｛　N
　…。　138）　　　　　　1956《　N　…。　109…111　'　）　　　　　　　　　　　　　196e（　N…48）
WAIS　　　　WAIS
　　　　r》c舅黼碧警蒋胁碧警
J931　S…B
（L和M形式）　　　　0；　65　　0；59　0。　64　0t　60　0。　54　0；　41　0。　39　0。28　0。29
1941　S…B
（L形式）　　　　0。　85　0…　S0　0。81　0~t　0。　68　0。　53　0。　57　0；　18
1956　S…B
（L形式）　　　　0。　83　0。　89　0＋　46　0。77　0。58　0。　68　0。　14
1956　WAIS
　　总分　　　　0＋　87　0＋　84　n　72　0。　73　0。　69　0＋　41
　　言语分　　　　O＋　59　0＋　73　0＋　63　0。700。　20
　　操作分　　　　n　36　0＋　67　0。　47　0。　57
1969　S…H
（L…M形式）　　　　0。77　0。　86　0。　36
1969　WAIS
　　总分　　　　0。　87　0。　74
　　言语分　　　　0。　38
洼：S…B是斯坦福一出纳测验，它在所有的年龄段上都旖测丁；WAIS是韦克
　　斯勒成人智为量表，它只在1956和1969年杖施测了＋所有的相关都
　　在0。　OI水平上显著。（取自坎加斯和布雷德韦，1971，表2。此表的
　　1931…1956部分是从布雷德韦和汤普森1962年发表于教育心理学杂
　　志上的一篇文章中摘取重印的。版权归美国心理学会。重印时得到了
　　许可。）
*由于两个被试的数据不完整，因此计算任何一个相关时所需要舶总被试
数就从109变成丁111。
不是WAIS分数之间求相关时，其相关系数还更高l并且反之亦然。
由于斯坦福一比纳测验是言语的，所以它不可能与WAIS作业部分
有相当高的相关。表12…1中列出的结果表明，对于这个而言，37年
间智力相当稳定。
　　坎加斯和布雷德韦研究的另一个有趣的发现是＋从4。　1…41。6
岁每个测试年龄上测验分数都增多了。这个增多对男性和女性（各
　　　　B～
·蕤
芸芸视频水久联系方式㈣：747883097　TL：028　8104　2202网址：http：i174
推荐：北京师范大学心理学专业20门主干课程DS视频图文并茂，音质圆润，
　　●
24人）进行了分别的探讨，并且又把这两个组进一步分成高得分组、
中等得分组和低得分组，组员分别是每个性别中最高分数的八人、中
等分数的八人和最低分数的八个人。结果被显示在图l2…l中。图370
中画出了男女高、低得分组在斯坦福一比纳测验中的IQ增加值。正
如已经提到的，所有组都被记录了连续的增加，其中包括没被显示出
的中等得分组。但是，有一组似乎远远地少于其他组：女性的高得分
组。这个结果可能不是由天花板效应（见第10和11章）引起的，因
为高得分组的男性显示出的是稳定增加。由于我们不知道得分高的
男性和女性最初是否相等，并且又由于得分低的女性提高了很多，因
此天花板效应的存在是可能的。
　　罔IZ…1成年前不同iQAe平男女的连续平均年龄上的斯坦福一比纳1Q
　　　　值的平均增加值
（取自戟加斯和布誓搏韦，1971，图l1197t年的版权归美国心理学会所有。
蘑印时得捌了许可。）
　　虽然这个研究本身还不能得出什么结论，但是一般而言它与以
往他人的研究一致，即证明丁所测量的智力在大部分人生（从儿童早
期到中年）中保持着相对的稳定。由此可知，心理发展的早期测量能
够预测后来的智力，这在博恩斯坦和西格曼（1986）的一个重要的纵
向研究中已经被确证了。
r1
u
747883097　TL。　028　8194　2202日址：http：　i1747883097　qzone　qq…
专业20门主干课程DS视频图文并茂，音质圆润，提供试看　　期待咨询
　　　　用作变量的年龄
　　　　在坎加斯和布雷德韦的研究中，他们感兴趣的最初变量是年龄。
正如前面讨论过的，年龄是一个被试变量。根据定义，被试变量不能
被实验操纵。研究者只能代之以选择满足不同类别和研究的实例。
因此，用被试变量进行的研究本质上是相关研究｝研究者能够辨认出
在一个被试变量中随着变异而发生变化的因变量，但很难把它归结
为被试变量和随被试变量一起变化的某一混淆因素。这在以年龄为
被试变量的研究中能够清楚地看出来。
　　　　最典型的变化年龄的实验设计被称为横切的设计。在这个设计
中，研究者截取总体中的一个部分

《实验心理学》

下载本书

实验心理学- 第70部分