《实验心理学》

下载本书

添加书签

实验心理学- 第70部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
上测量丁你的智力之后下午又重测了,那么任何的变化都可以被假
定为是由测量误差引起的而不是智力上的真正变化。)使用这个假
设,研究者就能够估算测量误差,并试着去提高和详细说明测量仪器
的信度。那么有关量的稳定性问题,本例中指智力,就能够被回
答了。
  我们先来回顾一些测验发展者用来评估他们的测量信度的技
术。然后再回顾一个多年来尝试着确定智力稳定性的研究。
  测验信度
  起初我们注意到,智力的概念并没有从理论上被很好地定义。
一些理论家假定了许多独立的心理能力,或许已超过了100种
(Guilford; 1967)。另一些人则相信,存在一个基本的心理能力和其
M,
∥润
雕圆
n质
h芷日

吧文
船圉
。频
坞视
81
g程
几千
。主
班川
他业
M专
g理
式心
方学
系大
联范
久师
水京
臻●
芸荐
芸推
    :㈣: 747883097 TL。 028 8194 2202日址:http: i1747883097 qzone qq 
428虞喜翠嚣磊黩享勰霉
    ,理学专业20门主干课程DS视频图文并茂,音质圆润,提供试看  期待咨询
    /实验心理学
r1
u
他被分离出来的许多具体能力,但这些具体能力不及基本能力重要
(Herrnsteiri和Murray,1995)。这个基本能力被描述为“一种抽象
推理和问题解决的能力”(Jensen,1969,p.19)。为了对它进行测
验,我们集合了许多问题或任务并呈现给个体,同时要求他们在一个
给定的时间内解决。把每个个体的分数与其他人的进行比较,在完
全相信这些分数之前,我们还需要知道它们的信度。如果我们在第
二天或一周后再测验他们,还会得到同样的分数吗?由于我们不相
信在如此短的时间内这个根本能力会发生明显的变化,因此,如果出
现了测验分数的大变化,我们就可以归结为测量误差,这也说明我们368
的测验没有信度。在一个短时期内相继给出两次同样的测验以确定
一个测量的被称之为测验一再测信度的东西。它通常以对大样本被
试的第一次和第二次测验分数之间的相关来表示。
    一个略有差别的程序可以避免诸如特殊的练习效应乏类的问
题。这个技术需要在两次施测中提供一个该测验的预备或平行形
式。如果此时两次测验分数的相关仍然很高,那么就证明了测验信
度是存在的。而且,该测验的两种形式是否等值也可以以这种方式
来确定。
  第三个计算信度的程序是通过呈现一个单独的测验来进行的。
这个技术提供了分半信度,它把同一个测验的项目随意地分成两组
(诸如序号为奇数的一组和序号为偶数的一组)并计算在该测验两个
半组上得分的相关。如果相关高,则说明测验信度确实存在。此外,
测验项目之间的等值也被确立了。
    智力铡■的稳定性
    通常能在现代的智力测验中发现很高的测验一再测信度(大约
0。 95的相关)。如果我们把这些测验看作是有信度的,那么我们就
能进一步问:个体被测量到的智力终其一生的稳定性如何。有许多
纵向研究已经开始探讨这个问题了,并且大约每十年总有一些报告
发表以便于当代人了解。一个研究报告(Kangas和Bradway,
1971)包括了不同时间在同一组被试身上进行的测验结果。其测验
的具体时间是:被试的平均年龄只有4岁多的1931年时首次进行的
斯坦福一比纳测验,以及后来的1941年、1956年和1969年进行的重
测。最初的样本是由旧金山海湾地区的儿童组成,他们是斯坦福一比
纳量表修订时所需要的全国标准化群体中的一部分。研究中运用了
两种形式的测验。在1941年,用同一个量表对138名被试进行了再
测;在1956年,IlI名被试受到了韦克斯勒成人智力量表和斯坦福一
比纳测验的再测。在1969年,只剩下48名被试同意被再谟l。
    在探讨这个研究的结果之前,我们应该知道它们只能代表那些
被收集数据的被试群。当然,它们也将代表与上述被试类似的群体。
它们可能会也可能不会代表在重要方面与上述被试不同的群体。
    坎加斯(Kangas)和布雷德韦(Bradway)提供的数据表明,在
1969年所测的48名被试与1956年施测的111名被试没有什么差
异。他们提供了两个年段的平均数和标准差以及每个年龄的斯坦
福一比纳测验的IQ值,并发现这两个样本之间没有差异。
    作者还对分数之间进行了配对相关的计算,其中1931年取的是
两个平行铡验值的平均数。在每个年龄都使用了斯坦福一比纳(S…B)
智力测验,而在1956年相1 969年还使用了韦克斯勒成人智力量表
(WAIS)。结果列在表12…1中。注意:WAIS包含一个言语部分和
一个作业部分,两部分的分数放在一起才能得到完整的分数。当你
从左往右看这个表时,你能看到,随着测验阃隔时间的增大,系列测369
验之间的相关减小。当计算平均年龄为4。1岁的学前儿童智力与其
他分数(表的最上边)之间的相关时,这种减小尤其明显。当计算成
人的相关时,它们的系数就要大得多。但是,所有表12…1中列出的
相关都具有统计上的显著性;因此可以说儿童4岁时测出的分数能
够在某种程度上(0。 41的相关)预测他们将来,哪怕是41; 6岁时的
情况。(我们应该也注意到,给4岁儿童施测的智力测验在问题的类
型上与年长儿童有很大的不同;这可能有助于解释他们之间的低相
关。)
    当从表的上部看到底部时,你可以看得出随着被试年龄的增长
1969年的测量值与前几年之间相关的增大。当只用S…B分数而
册1
 4 1
\、广
  骊
  嚣瓣
  箬
  ∥润
  雕圆
  n质
  h芷日
  黠
  吧文
  船圉
  。频
  坞视
  81
  g程
几千
。主
班川
他业
M专
g理
式心
方学
系大
联范
久师
水京
撬●
芸推
    :㈣: 747883097 TL: 028 8194 2202日址:http: i1747883097 qzone qq…
430蓐喜翠曩票磊薯类享惑登霉
    ,理学专业20门主干课程DS视频图文并茂,音质圆润,提供试看  期待咨询
    /实验心理学
表n…i 1931…1~69年期问四个年龄的IQ谢验舟教之间的相关
测  验
1941{ N
 …。 138)      1956《 N …。 109…111 ' )             196e( N…48)
WAIS    WAIS
    r》c舅黼碧警蒋胁碧警
J931 S…B
(L和M形式)    0; 65  0;59 0。 64 0t 60 0。 54 0; 41 0。 39 0。28 0。29
1941 S…B
(L形式)    0。 85 0… S0 0。81 0~t 0。 68 0。 53 0。 57 0; 18
1956 S…B
(L形式)    0。 83 0。 89 0+ 46 0。77 0。58 0。 68 0。 14
1956 WAIS
  总分    0+ 87 0+ 84 n 72 0。 73 0。 69 0+ 41
  言语分    O+ 59 0+ 73 0+ 63 0。700。 20
  操作分    n 36 0+ 67 0。 47 0。 57
1969 S…H
(L…M形式)    0。77 0。 86 0。 36
1969 WAIS
  总分    0。 87 0。 74
  言语分    0。 38
洼:S…B是斯坦福一出纳测验,它在所有的年龄段上都旖测丁;WAIS是韦克
  斯勒成人智为量表,它只在1956和1969年杖施测了+所有的相关都
  在0。 OI水平上显著。(取自坎加斯和布雷德韦,1971,表2。此表的
  1931…1956部分是从布雷德韦和汤普森1962年发表于教育心理学杂
  志上的一篇文章中摘取重印的。版权归美国心理学会。重印时得到了
  许可。)
*由于两个被试的数据不完整,因此计算任何一个相关时所需要舶总被试
数就从109变成丁111。
不是WAIS分数之间求相关时,其相关系数还更高l并且反之亦然。
由于斯坦福一比纳测验是言语的,所以它不可能与WAIS作业部分
有相当高的相关。表12…1中列出的结果表明,对于这个而言,37年
间智力相当稳定。
  坎加斯和布雷德韦研究的另一个有趣的发现是+从4。 1…41。6
岁每个测试年龄上测验分数都增多了。这个增多对男性和女性(各
    B~
·蕤
芸芸视频水久联系方式㈣:747883097 TL:028 8104 2202网址:http:i174
推荐:北京师范大学心理学专业20门主干课程DS视频图文并茂,音质圆润,
  ●
24人)进行了分别的探讨,并且又把这两个组进一步分成高得分组、
中等得分组和低得分组,组员分别是每个性别中最高分数的八人、中
等分数的八人和最低分数的八个人。结果被显示在图l2…l中。图370
中画出了男女高、低得分组在斯坦福一比纳测验中的IQ增加值。正
如已经提到的,所有组都被记录了连续的增加,其中包括没被显示出
的中等得分组。但是,有一组似乎远远地少于其他组:女性的高得分
组。这个结果可能不是由天花板效应(见第10和11章)引起的,因
为高得分组的男性显示出的是稳定增加。由于我们不知道得分高的
男性和女性最初是否相等,并且又由于得分低的女性提高了很多,因
此天花板效应的存在是可能的。
  罔IZ…1成年前不同iQAe平男女的连续平均年龄上的斯坦福一比纳1Q
    值的平均增加值
(取自戟加斯和布誓搏韦,1971,图l1197t年的版权归美国心理学会所有。
蘑印时得捌了许可。)
  虽然这个研究本身还不能得出什么结论,但是一般而言它与以
往他人的研究一致,即证明丁所测量的智力在大部分人生(从儿童早
期到中年)中保持着相对的稳定。由此可知,心理发展的早期测量能
够预测后来的智力,这在博恩斯坦和西格曼(1986)的一个重要的纵
向研究中已经被确证了。
r1
u
747883097 TL。 028 8194 2202日址:http: i1747883097 qzone qq…
专业20门主干课程DS视频图文并茂,音质圆润,提供试看  期待咨询
    用作变量的年龄
    在坎加斯和布雷德韦的研究中,他们感兴趣的最初变量是年龄。
正如前面讨论过的,年龄是一个被试变量。根据定义,被试变量不能
被实验操纵。研究者只能代之以选择满足不同类别和研究的实例。
因此,用被试变量进行的研究本质上是相关研究}研究者能够辨认出
在一个被试变量中随着变异而发生变化的因变量,但很难把它归结
为被试变量和随被试变量一起变化的某一混淆因素。这在以年龄为
被试变量的研究中能够清楚地看出来。
    最典型的变化年龄的实验设计被称为横切的设计。在这个设计
中,研究者截取总体中的一个部分
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架