新闻详情

小样本实验研究设计方法与思路

作者: 刘勇、王涛新闻来源: 中国心理网应用技术专栏发布时间: 2013-02-01

一、问题的提出

1．再实用的心理技术也需要验证性科学实验研究

2006年12月，美国迈阿密大学王爱民教授应辽宁师范大学的特殊聘请暨辽宁师范大学杨丽珠教授的特别邀请，前来我校进行短期工作。其中的一项重要内容就是要帮助辽宁师范大学心理咨询中心对正在使用的一套高效的心理技术进行科学研究方法上的升级。

我们都知道，由于金洪源教授及其所带领的研究生学习团队近年开发研究的心理学临床咨询治疗新技术，已经被大量的临床治疗事实证明是一套易学易用，简捷而高效的新的实用技术。无论是对于广大咨询员，还是对于广大从中受益的来访者来说，它的高效、实用的特点已经是人所共知的事实。

为此，很多人对此不理解，认为多年多人用临床治疗事实明明白白地证明了的实用、高效技术，为什么要花很大的精力去搞什么科学实验方法上的检证证明？对于这个问题的回答其实可以从另一个角度进行回答，那就是科学与技术的关系。科学是通过逻辑性、实证性所反映的客观事物的关系和规律的真理性的系统化知识体系。我们知道心理学是一门科学，作为科学家族的一个成员，就要要求它具有科学上的一般特点。科学是一个求“真”的过程，无限追求真理的过程。科学本身有一套标准的研究范式。要求每个学科本身对其研究过程，以及研究对象，进行可观察，可控制，可重复的实验研究。也就是说对一某一现象不但描述它是什么，而且不要进行证明它肯定是什么。而为了增加其客观性，可操作性要对其进行量化处理。比如我们经常提到的，经过我们治疗来访者的情绪明显好转，那么什么叫明显好转？是一天笑两次叫明显，还是笑一次？技术是人们在生产活动中，各种具体技艺，经验和具体知识。技术是围绕具体的生产对象组织知识和技巧的，便于应用，而科学是从认识论上组织知识的，便于学习，便于探索。其次，技术关心的是知识是否迅速的转化为财富，注重创新，但不关心对事物本质的认识，因而扩展知识的能力较弱；而科学注重于说明事物的本质，因而具有很强地的扩展知识的潜质，但由于科学不是从具体应用的角度组织知识的，则实用性不如具体技术。从科学与技术的关系的方面上看，我们可以看出科学与技术的结合才是最佳的方法途径。这也是为什么说科学技术是第一生产力的原因所在。没有科学的研究方法作为指导，很可能把一套高效的技术与一些非科学的东西混在一起，容易被人所质疑。因此我们有必要把科学的研究方法提到日程上来，这样就需要小样本研究范式的实验研究模式，以此作为指导性的规范来帮助广大临床心理学工作者走上科学的研究之路。

2．临床心理咨询与治疗为什么要进行小样本的实验设计

随着现在科学技术和心理学的发展，在心理学研究的实践中逐步形成了两种主要的研究范式：大样本研究范式与小样本研究范式。大样本的研究范式现在被运用的较多。它可以运用组间和组内的变异，复杂的统计方法，科学的实验设计来控制一些无关变量，来分析自变量和因变量的两者的关系，从而得出某种结论。但这种研究方法不适合做临床心理咨询的工作者们。因为心理咨询很难在同一时间内找到大量的具有相同病症的被试。后来人们提出运用一些个案研究方法（case study）来弥补这方面的不足。然而，这种研究方法所得结果通常是描述性的、不能重复的，缺乏实验科学的严格性。如果采用传统的实验组和对照组的设计方法，对患有心理障碍的人进行治疗，也会产生许多问题。因为在临床心理学领域中所涉及的问题一般都带有明显的个体特点，在许多情况下，相同的病例很少，不能进行组间实验研究。个案小样本实验设计方法是把实验研究应用于个别被试的设计方法，既具有实验科学的严谨性，又不受人数的影响，把临床治疗与实验评定结合在一起，这在临床心理学研究中具有极其重要的意义，此种方法一出现就被广大临床心理学家所重视。

二、个案小样本实验设计基本术语及方法

1．基本术语

通常个案实验设计要求研究者在治疗开始前对被试进行几天的行为观察，这一时期称之为“基线阶段”，所获得的咨询称为“基线数据”。基线观察主要有两种作用：一是描述作用，所得的基线资料能够对被试的状况或行为作较全面的描述，研究者在基线数据的基础上确定治疗范围以及治疗的类型；二是推断作用，基线数据可以作为对被试行为发展趋势进行预测和描述的基础，即推测不进行治疗被试近期会有什么为行水平，个案实验设计原理在很大程度上取决于基线数据的推断作用。

自变量（Independent Variable）是由研究者选定，并进行操纵、变化的能产生所欲研究的心理现象的因素，或因素组合。作为研究者操纵变化这些因素是想了解这些因素的不同变化，对人的心理或行为产生哪些影响。因变量（Dependent Variable）它是被试由自变量所产生的反应或输出。它依据自变量的变化而变化，但不能简单认为它是自变量的结果。因为可能是其它无关变量所形成的。控制变量(Control Variable)是心理实验中能影响因变量的变化，但非研究者所选择的、操纵，必须使之控制的因素，称之控制变量，又称无关变量。只有当这些无关变量进行控制，才能研究自变量与因变量的关系。

比如研究声音的强度对消费者购买行为影响。在这个实验中，声音的强度是自变量，消费者所做出的购买行为就是因变量。而商场的大小，商品的价格，消费者的购买力等等都是控制变量。再比如研究一种新的教学方法对学习成绩的影响的实验研究。新的教学方法是自变量，学习成绩是因变量，学生原有的成绩，老师的教学水平，家长的对实验研究的态度等等是控制变量（无关变量）。

2．具体的实验设计方法

⑴ AB设计

在这种设计中A代表的是治疗前的基线状态，B代表的是治疗后的状态，治疗是自变量。这种设计经常应用研究在医疗、教育和其他应用研究方面。在这些研究中，我们关心的主要是治疗或训练的措施对问题行为的效果。

然而AB设计不是一种有效的实验设计，应当避免使用。之所以不好是因为B阶段发生的变化可能是其他因素导致的，这些因素与我们感兴趣的因素发生混淆。治疗可能产生行为改变，但同时其它没有意识到的因素或无法控制的因素也会对行为的改变产生影响。所以由于没有控制组的对比，我们不能得出行为的改变是由治疗干预所导致的。解决这一问题，最好的办法就使用大样本设计。我们可以把被试随机分成两组，一组是实验组，接受治疗；另一组是控制组，不接受治疗。如果实验组的状况随着治疗的进行而得到改进，控制组的状况没有发生变化，我们就可得出结论认为，是治疗而不是其它无关因素导致了这个结果。然而一个大样本的设计，其实验组和控制组一般都要大量的被试，因此在评价治疗效果时，这种设计方法是不合适的。

⑵ ABA（B）设计

ABA（B）设计又称反向设计，如（图1）所示：图中的第一个阶段表示基线阶段，通过基线数据对未来的行为进行预测，即推断若不对被试进行干预，其行为将表现为A的延续（B中的虚线）。只有在基线数据较为稳定并且没有规律性的改变时，推断才是比较肯定和可靠的。所以，在临床实验中，一般要等基线稳定和对未来的预测有一定把握之后，才进入第二阶段（B），实施干预。

在第二阶段，研究者要继续对被试进行行为观察，以了解在干预过程中被试的实际行为水平（B中的实线）是否超出或离开了基线预测的水平。如果干预是有效的，实际行为表现应明显超出预测水平，如图（1）2所示的那样，在干预阶段被试的行为已经发生改变，超出了预测水平（实线远远超过虚线）。这种变化可能是治疗干预的结果，但仅凭一次干预是不能得到确定的结论的。

干预阶段的行为变化可能并不是由治疗产生的，而是一些外部因素影响的结果。为了证实治疗的效应，在第三阶段撤消干预（A），并把这阶段的行为水平与干预阶段预测的行为水平加以比较。由于撤消干预，被试实际上又回到基线状态，他的行为水平也随之必然回到基线水平。从第三阶段的资料对下一阶段的行为再次做出预测（B的虚线）。最后，在第四个阶段再次给予干预，如果被试的成绩再次超过基线水平（如图1）4所示，就可以证明治疗干预确实是行为变化的原因。

图1 基线阶段和治疗阶段行为水平的假设

实线——每特定阶段的实际成绩

虚线——由前阶段预测成绩的设想水平

这个基线观察到干预的实验过程也可以用另一种形式来说明如图2所示，图中黑色节点线(Engagement)表示所期望发生的行为反应。空心节点线(Problem behavior)表示的是问题行为，是需要改变的行为反应。在第一个基线时是在不给予干预的情况下进行一段时间的观察，并记录下来其中的变化作为基线指标（第一个A）。然后进行第一次的干预，看发生变化的情况，同时将行为记录下来（第一个B）。之后停止干预一段时间看问题行为与期望发生的行为的变化（第二个A），即撤消治疗，使实验条件恢复到基线状态，被试的行为也逐渐降到基线水平。这一阶段是为检验治疗的效果，使行为恢复或接近最初的基线水平而设置的，因此又称之为“反向阶段”。接下来再次进行干预，看其实验结果（第二个B）。在这个过程第一次干预时间的把握是一个很重要的问题，如果时间长，把病情完全控制住了，就不可能有反复现象出现。如果干预的时间过少也许第一次效果（B）就不会那么明显。在这种实验设计中，如何把握这个时间是一个实验过程中的一个关键的问题，需要研究人员自己不断的探索。假如被试的行为成绩仍能达到或接近前一治疗阶段的水平，就清楚地证明了治疗干预的效果。

图2个案实验研究中期望行为与问题行为在基线阶段与干预阶段的变化示意图

ABA（B）设计还有许多变式，比如BABA，AB₁B₂AB₂等等。由于篇幅所限这里就是在介绍，感兴趣的读者请查阅相关资料。

ABA（A）设计及其变式的主要特点是治疗与停止治疗在实验过程中反复交替出现,通过被试的行为随实验条件变化而变化来证明治疗的效果。这种设计通常用在一个时期内只有一个被试的临床实验研究中。此方法解决了只有一个被试时不能有效说明实验结果的难题。而且研究者没有运用一些复杂的统计方法，没有用推论统计去证明所得出的结论。而是通过对自变量的良好控制和因变量的反复测量，记录在不同实验条件下所出现的明显差异，使得统计推断显得多余。ABA小样本实验设计的使用本身就能够得出强有力的实验推论，为个案实验研究提供了良好的研究范式。

当然每一种设计都有其不足之处，当把ABA（B）设计应用到临床治疗时，必须考虑由于撤消治疗所而带来的问题。从论理道德角度来看，为了证明治疗的有效性而撤消治疗是违反道德原则的。从临床治疗的观点看，为了检验治疗效果而中断治疗，便病情再次加重，对病人是不负责的，而且有时病人没看到效果或病情出现反复会自动中止治疗。在许多情况下，有时撤消干预后，再一次的干预效果没有第一次干预不停止效果好。因此，ABA（B）设计及其变式提供了一种对治疗效果进行强制性检验的实验手段，然而恰恰就是因为这种实验手段使得ABA（B）设计不能在临床上广泛应用。

⑶ 多种基线设计

为了克服ABA（B）实验设计的不足，有人提出多种基线设计。多种基线设计不仅适应单个被试的实验研究，考察一个被试中不同行为在同一实验中的变化；也可以考察多个被试中的同一行为在一个自变量干预下的所产生的变化。

①对于单个被试不同行为方面的考察是这样进行设计的：在确定了要进行治疗的行为之后，对这些行为基线观察，待基线数据稳定后开始对其中一种行为进行治疗，其他行为仍保持在基线状态下，继续对所有的行为进行观察，预期被治疗的行为将会发生变化，而其他行为将保持在基线水平上。当行为的变化趋于稳定之后，治疗者应用同一治疗干预对另一行为进行治疗，同时观察所有的行为。这样，在整个治疗期间依次对每一种行为进行治疗。一个治疗阶段只治疗一种行为，其他行为保持不变。如果每种行为的变化都发生在对这一行为进行治疗时，而不是在治疗之前，就可以证明治疗干预是有效的。如图3所示，运用一种行为干预技术对一个被试的人际关系方面进行干预治疗，此被试出现的问题是缺少与父母、同学，老师的正确交往行为。干预的目标让其建立正确的交往行为反应。训练前对与父母、同学、老师的交往行为进行基线的观察，然后在第一个阶段只对与父母交往行为进行训练，看其行为的变化。并对其它两种行为仍做基线观察，第二阶段对与同学交往行为进行训练，然后记录其行为方面的变化。此时对于与父母交往时干预后的行为仍做记录，对与老师的交往行为仍做基线观察。第三阶段对与老师的交往行为进行干预，看其干预后的变化，并对另外两种行为进行观察。我们可以清楚的看到每种行为的变化都是在对其进行干预后产生的，而不是在治疗之前；而且一个阶段只干预一种行为。因此可以证明治疗干预是有效的。

图3多种基线设计中对单个被试不同行为干预的实验设计举例

②如果同时有一两个或两个以上的被试进行干预实验，我们同样可以用多基线实验设计来进行实验。这样可以排除更多无关变量的干扰。具体的作法如图4所示。

三个患有强迫症的被试，通过某种方法的干预来治疗其强迫行为或思维。三个被试几乎是同一时间来到行为干预实验室。同时对三个被试进行基线观察，记录其每天强迫行为出现的频率，可以让被试自己报告，周围人报告，以及主试自己观察来进行。基线稳定一段时间后，对第一个被试进行干预，观察记录被试1的行为变化，同时仍对被试2和被试3进行基线观察。第二阶段对被试2进行干预，对初试1和被试3进行观察，第三阶段对被试3进行干预，对另外两个被试进行观察。如果实验的结果如图所示，三个被试的行为变化趋势都是在对其进行行为干预后发生的，在干预之前没有变化。我们就可以认为被试行为发生的改变是自变量对行为干预的结果而不是其它无关因素，比如被试成长因素、环境因素等。

图4多种基线设计中对多个被试相同行为干预的实验设计举例

多基线设计存在这样的问题：一种行为基线的变化可能与其他基线的变化相互关联，即所观察的几种行为可能是关联的而不是独立的。在这种情况下，对一种行为进行干预，其它行为也可能发生变化。当把多种基线设计应用于治疗几个病情相同的病人时也存在着这种可能性，即对其中一个病人的治疗会改变其他病人的行为。假如对一个或几个被试在几种不同情境的行为进行观察和治疗时，对一种情境下行为的干预也可能影响其他情境下的行为。

这种泛化效应存在于每一种多种基线设计的变式当中。幸运的是在已经报道的多种基线设计的应用中，泛化效应的发生率很低。但是在应用这种设计于临床治疗时，仍要特别注意这个问题。如果泛化效应明显时，可以采取一些措施来减轻其对治疗效果的影响。比如，使用更多的行为基线和基线指标，因为不可能每种基线之间都是相互关联。另外，还可以在设计程序中增加一些其他个案实验方法。比如，对其中一种行为暂时中断治疗，即增加一短暂的“反向阶段”，以证明治疗与行为变化之间的关系。最重要的是，在选择行为基线时，每种行为基线都明显地与其它行为相区别。

综上所述，多种基线设计能够同时对多种行为，多个被试进行观察与治疗，在治疗过程中不需要暂时中断治疗来证明治疗的效果。因此具有省时高效的优点，但对可能存在的泛化效应要予以注意。

除了AB设计、ABA（B）设计以及多种基线设计以外，通常运用的还有变化标准设计和同时治疗设计等等。这些方法都有其各自的优缺点，由于文章篇幅所限，这里就不在介绍了。

四、关于小样本及个案临床实验设计的思考

个案实验研究(Single-case experiment)是方法学上的重要进步。它的出现让人们从概念上区分并重视到，传统的个案研究与个案实验研究是有着本质的区别的。过去，一般把对个别病例的研究限制在单纯的个案研究（case study），例如对个案进行描述、自传研究等。从这些个案研究中虽然能获得许多生动和有意义的第一手资料，但是由于没有严密的实验控制，使研究结果不能被重复验证，因此不能作为真正的科学资料来源。而个案实验设计研究方法则是把丰富的临床实践与科学的方法学结合在一起，即在个案研究中运用实验设计的方法，使临床应用研究具有科学的严格性。

根据小样本研究范式，研究应包括三个阶段：⑴确定所研究对象的行为基线或反应方式；⑵操纵自变量，观察和记录因变量的变化；⑶撤除自变量，继续监测因变量的情况。小样本研究范式已逐步为许多心理学家所采用，它与大样本范式相比，更严密地监测了对象的行为，更系统地测量了自变量的效应，并得以更细致地进行“被试内”比较和分析。但是许多研究也表明，小样本研究范式的外部效度不易达到要求，并容易受被试系统误差的影响。因此，对小样本范式应作更多的验证性研究。

每种科学的实验范式都有其可取之处以及不足，当前心理学过于重视大样本的研究范式，导致心理学研究中有一种过分重视P值的倾向，甚至达到了对P值迷信的地步。出现有些研究为了能够产生实验所期望的效果过于追求实验被试的个数，当样本达到足够大时，很容易出现显著差异。其实这是一种违背科学研究精神的不良现象。在这个意义上说，个案实验研究虽然被试数量少，但它更为客观、真实。只要进行重复的验证性实验，就能够消除系统误差。而且这种设计由于没有更多的控制条件，没有进行更多的人为处理以及实验室的控制，所以它更适合进行个案的临床研究，更接近生活实践。

元认知干预技术研究所信箱：13390021338@163.com

作者简介：

刘勇，男，辽宁师范大学应用心理学2005级硕士研究生，强迫症治疗新技术研究全国协作组主成员之一。在复杂神经症，特别是焦虑症、情感依赖和中学生学习行为障碍诊断与辅导治疗等多方面取得显著成绩。积累了较丰富的临床个案与小样本研究经验。

王涛，女，辽宁师范大学应用心理学2005级硕士研究生。强迫症治疗新技术研究全国协作组主成员之一。在重度抑郁症、学校恐惧症、学生学习障碍等方面取显著临床干预效果。擅长对复杂的重症患者行为修正临床技术设计与实施。

下一篇: 论心理学发展的困境与出路 上一篇: 神经症、学习障碍两大难题的心理技术突破——访辽宁师范大学应用心理学教授金洪源

顶(22) 查看评论(0) 点击:13980

留下评论

会员登录后才可以评论

更多>>

图片故事

高效心理技术正在改变着世界——元认知干预技术暨《中小学心理健康教育》(2014)年会侧记

更多>>

研修生园地

更多>>

学校教育

更多>>

新闻详情

小样本实验研究设计方法与思路

留下评论

图片故事

研修生园地

学校教育

投票