第一篇试验设计原则及案例分析
第一章试验设计概述
在20世纪20年代至40年代初,英国科学家费希尔(R.A.Fisher)运用拉丁方设计解决了长期未能解决的试验条件不均匀问题,并将这一方法应用于农业生产。随后,英、美、苏等工业化国家将试验设计及其分析方法推广到工业领域。日本统计学家田口玄一博士于1949年创造了正交试验设计方法。我国学者王元、方开泰等于1978年创立了均匀试验设计方法。目前,试验设计作为相对独立的一门学科,正在生物、医药、农业、工业等领域发挥越来越大的作用。
第一节生物学试验设计的特点、基本要素与注意事项
一、生物学试验设计的特点
生物是有生命的,存在节律特性,以及取食、生长、代谢、发育、繁殖等生理活动,受环境影响较大。因此,控制非处理因素很重要。
生物学试验设计的主要特点包括以下几点。
(1)试验材料个体差异较大。一般来说,获取纯合一致的试验材料不易,有时(如大动物)甚至很困难。因此,常常需要利用局部控制原则,对非处理因素进行局部控制,随机区组设计是常用的试验设计方法。
(2)取样时间很关键。因为生物常常具有特定的节律性,因此取样时间不仅要固定在一天的某个时间,而且取样时间要有针对性(针对所研究的问题)。在冈比亚按蚊中,至少有2000个以上的基因具有节律性表达特性。一些农药在每天不同时间点具有不同的杀虫效率,例如,吡虫啉在中午12:00对褐飞虱的防治效果比下午16:00高约20%,敌蝇威对蟑螂的毒性在夜间相对较大。又如,在分析食物消耗和大鼠活动的数据之后发现,作为夜行生物的大鼠进食大部分是在黑暗的时候,在晚上11点~早上5点这个时间段中,大鼠的食物消耗变动很少,因此在研究食物对大鼠某些指标的影响时,在凌晨4点左右取样较好。
(3)经常需要利用突变体材料作为对照,特别是研究基因功能时。一种方法是通过基因敲除或过表达获得突变体(然后测定各种生物学参数或指标),另一种方法是筛选自然变异材料。
(4)需要设置稍多的重复数。在试验过程中,有时会出现生物发育不正常甚至死亡等现象,因此在实际操作时通常需要设置稍多的重复数,以确保有足够的有效重复数,以便获得可靠的观测指标值。
(5)试验周期较长。有些生物(如酵母、大肠杆菌、果蝇等)世代发育时间较短,因此作为试验材料有一定的优势。有些生物(如杨树)的生长期很长,获得试验数据的难度就较大。
二、试验设计的基本要素
试验设计的基本要素包括试验因素、试验单元和试验效应。
1.试验因素
试验因素简称为因素或因子,是试验中所研究的影响试验效应的原因或原因组合,常用大写英文字母表示。因素的具体取值称为水平,可用A1、A2、A3等表示。确定因素水平的数量及具体数值需要专业知识,常常需要阅读文献来确定。在缺乏文献时,可以先做预试验。因素水平选取得过于密集,试验次数就会增多,许多相邻的水平对结果的影响十分接近,将会浪费人力、物力和时间,降低试验的效率。
因素可分为固定因素(可控因素)和随机因素(非可控因素)。例如,人为设置的温度是固定因素,大麦中的水分是随机因素。
2.试验单元
试验单元是试验中能接受不同试验处理的独立的试验载体,实际上就是根据研究目的而确定的观测对象。例如,比较不同水稻品种的产量时,水稻是试验单元;比较毕赤酵母处理前后的抑菌效果时,毕赤酵母是试验单元;比较褐飞虱不同地理种群的抗药性时,褐飞虱是试验单元。
在医学和生物学试验中,试验单元也称为受试对象,选择受试对象不仅要依照统计学原理,还要考虑到生理和伦理等问题。例如,在选择动物为受试对象时,要考虑动物的种属品系、窝别、性别、年龄、体重、健康状况等。
3.试验效应
试验效应是试验因素作用于试验单元的反应,是研究结果的*终体现。观察或获取体现试验效应的指标时,要特别注意随机的重要性。例如用A1、A2、A3、A4和A5五种饲料饲喂家鸡,一个月后称重。如何体现称重对象的随机性就很重要,因为家鸡存在代谢活动,人为的称重早或称重晚都会导致结果不正确。
而且,试验效应要具体,不能模糊。例如,研究三种饲料对生猪增重的影响,其效应是增加的体重,很明确。又如,研究温度对赤眼蜂的影响,试验效应就不够具体,到底是什么影响,没有清晰说明。
三、生物学试验设计的注意事项
制定生物学试验计划时,需要注意以下五点。
1.试验目的要明确
试验目的明确,就是要明确该试验需要解决的科学问题。科学问题的重要性决定了试验的价值。试验目的常常通过具体的观测指标来实现,因此观测指标要具体,例如鉴定某个受体的配体。在研究生介绍研究计划时,有时会出现观测指标不明确的现象,例如研究某个条件对某种生物的影响。此外,该试验是初筛还是详细研究?也需要事先确定,因为初筛往往只设置1个重复,并且观测指标少一些,而详细研究则需要多个重复且有更多的观测指标。
2.试验材料要满足要求
生物学试验材料的获取往往有一定难度。例如,保护性动物(如大熊猫)的样品获取需要仔细思考实施方案,获取遗传背景一致的大型养殖动物(如猪)比较困难。我们在制订研究计划时,需要根据试验材料选取合适的试验设计方案。
3.试验条件要有代表性
试验条件要能够代表将来准备推广该试验结果的地区的生产、经济和自然条件。只有这样,试验结果才能符合实际。例如,研究温度对水稻生长的影响,该温度梯度就不好:25℃、26℃、27℃、28℃、29℃,不仅因为不同温度水平之间只相差1℃,试验仪器的精度通常难以保证达到要求,而且温度幅度太窄,缺乏代表性。
试验条件的选取很重要。一般来说,我们可查阅文献获得一些基本信息,例如水稻生长的适合温度通常在25~30℃,因此可以此区间为中点设计温度梯度,如16℃、20℃、24℃、28℃、32℃、36℃。如果是原创性研究,没有相关文献可供借鉴,通常设置幅度较宽的水平梯度(如0℃、20℃、40℃、60℃、80℃、100℃),然后利用正交设计进行初筛,然后再进行详细研究。
4.试验结果要可靠
高度的责任心和科学的态度是保证试验结果可靠性的必要条件。在试验过程中,要严格按试验要求和操作规程执行各技术环节,避免发生人为的错误和系统误差,尤其要注意试验条件的一致性,减少误差,提高试验结果的可靠性。一个试验如果需要多人完成,要保证每人完成固定的步骤。试验指标的测量如果有多台仪器,尽量使用同一台仪器进行测量。
为了保证试验结果能够重演,要对试验过程进行详细、完整、及时和准确的记录,以便分析各种试验结果产生的原因。
5.试验设计方案要能反映预定试验目的
在制订试验方案时,要确保能实现预定的试验目的。在试验过程中,对试验方案进行优化或修改也很常见,这个阶段也要紧盯*初的试验目的。下面通过一个例子加以说明。
试验目的:摄食足以引起肥胖的高脂肪的大鼠和正常饮食的大鼠相比,肝脏哪些基因的表达发生了变化?
研究者*初的试验设计方案如下。①试验方法:成对试验;②饲喂时间:利用高脂肪的饲料和正常饲料饲喂大鼠12h,然后取大鼠的肝脏用于转录组测序,取样时间:早上7点,设10次重复;③利用转录组测序获得差异表达基因。通过这一试验方案,可获得摄食高脂肪12h后大鼠肝脏中的差异表达基因。但是,与*初的试验目的相比,两者并不一致。因此,研究者应该思考原因,发现应该等到高脂肪饮食后大鼠变得肥胖再开始试验。
在肥胖大鼠肝脏中,对于不同的表型“标记”,基因表达变化也会不同。这些“标记”有:体重的增加、对胰岛素不敏感、肝酶的变化、脂肪肝等。在研究者的试验中,利用2个月的体重增加量和对胰岛素的不敏感度来定义“肥胖”。然后,研究这个阶段的基因表达变化。因此,选择一个清晰的“标记”或标准来定义相关的结果,可以保证采用的试验方案能够反映预定试验目的。*终的试验设计方案如下:①10只大鼠饲喂正常饲料,10只大鼠饲喂高脂肪饲料,即重复10次;②每组中的大鼠按年龄、性别和起始体重配对;③每周测量大鼠体重和血清化学参数。当大鼠呈现肥胖和胰岛素不敏感时,取出大鼠肝脏用于转录组测序;④取样时间:凌晨4:30(详见本节生物学试验设计的特点);⑤分析差异表达基因并进行验证。
第二节试验设计的基本原则
试验设计的总目标是用较少的人力、物力和时间获得尽可能多且可靠的数据资料。因此,需要考虑人力、物力和时间等需求,观测指标具体且做了合理安排,重要的非处理因素都得到了有效的控制。对试验的操作方法、试验数据的收集、整理、分析方式都已经确定了科学合理的方法。此外,试验中可能出现的各种意外情况都已考虑在内并有相应的对策。从涉及的统计要求看,一个完善的试验设计方案应该明确试验因素、试验单元和试验效应,并充分体现随机、重复、对照和局部控制四个基本原则。
一、随机化原则
随机化是指每个处理以概率均等的原则,随机地选择试验单元。例如用A1、A2、A3、A4和A5五种饲料饲喂家鸡,每种饲料30只鸡。在实际分组时可以采用抽签的方式,把150只家鸡按任意的顺序编为1~150号,用外形相同的纸条写出1~150个号码,从中随机抽取30个号码,对应的30只鸡分配给A1组,类似地可完成其他组的动物分配。一个月后称重时也要体现随机化原则。如果每只鸡是单独饲养的,可通过产生随机数的方式抓取对应编号的鸡称重。如果各组的30只鸡是混合饲养的,可采取分层随机的方式。首先在1~5之间产生一个随机数(假设是3),然后在A3组中随机抓取1只鸡称重;接下来再产生一个随机数(假设是2,如仍是3则重新产生),在A2组中随机抓取1只鸡称重,依此可完成一个循环:在五组中各随机抓取1只鸡称重。重复这个循环即可完成其他动物的称重。
如果违背随机的原则,不论是有意或无意的,都会影响试验结果的正确性,给试验结果带来偏差。如果我们在上述称重过程中,按A1至A5的顺序依次称重(首先称重A1组的30只,*后称重A5组的30只),则会人为导致A5组的动物体重偏低等偏差,因为动物的消化等生理活动导致一段时间后的体重会相对低一些。随机化试验就是避免此类偏差的有效手段。
随机化原则的另外一个作用是有利于应用各种统计分析方法,因为统计学中的很多方法都是建立在独立样本的基础上的,用随机化原则设计和实施的试验就可以保证试验数据的独立性。
二、重复原则
重复是指在试验中,将一个处理实施在2个或2个以上的试验单元上。在相同的处理条件下对不同的试验单元做多次试验,这是人们通常意义下所指的独立重复试验。通过重复,可以计算试验误差,可以从统计学上对处理的效应给以肯定或予以否定。
从统计学的观点看,重复数越多试验结果的可信度就越高,但是这就需要花费更多的人力、物力和时间。因此,重复数的多少,应根据试验的要求和条件来确定。如果是初筛试验,可以只做一个重复(n=1),找到比较可能的条件后再增加重复数。如果试验效应值的方差较大,一般需增加重复数。有些试验由于其重要性(例如开发人类某种疾病的诊断方法),通常需要较多重复数。此外,发表论文时,不同的刊物对试验重复数的要求也不尽相同。在获得部分试验数据后,利用R语言的pwr包可以估算在某一概率条件下获得显著差异试验结果所需要的重复数。
针对重复数,是否有一个客观的标准呢?答案是肯定的。这时,我们需要实施的试验重复数(m)要大于*少重复数(n),即m>n。然后我们对m个重复的试验结果数据进行子集分析,即每次任意减少一个重复的数据,然后比较任何一个更小的数据组能否得出与m个数据组相同的结果,直至不能减少为止。这样,*后那个与m个数据组的结果相同的数据组的重复数即为*少重复数。也就是说,要获得*少重复数通常需要做更多的试验,因此这种方法不常用。
展开