在STEM的课堂上,我们究竟该“问”还是该“讲”?
(转载自:STEAM课程中心)
讲授式教学能够最大程度的促进学生学习和提升成绩吗?为了考察这一假设是否成立,我们针对225项现有研究进行了一次元分析。这些研究中的数据均为大学生在传统教学模式或主动学习模式下,在科学、技术、工程和数学(STEM)四门课程中取得的考试成绩或不合格率。本次元分析的效应值(Effect Size)表明,在参加考试和概念测试(concept inventory)时,学生在主动学习(n = 158)方式下成绩的标准差增加了0.47,在传统教学模式(n = 67研究)下,不合格比值比(odds ratio)为1.95。
上述结果表明,在主动学习方式下学生的平均考试成绩提高了约6%,采用传统教学方式的班级学生比主动学习方式下不合格的概率高出1.5倍。异质分析表明上述结论适用于STEM课程涉及的各个学科,而且主动学习模式下学生在概念测试中分数提升效果比课程考试更为明显。此外,分析还表明,主动学习方式在不同班额条件下都会对学生成绩产生积极影响,特别是50人以下的小班影响最为显著。
Trim and Fill分析和Fail-Safe N计算表明我们的结果不受发表偏倚干扰。因为对学生素质和教师水平进行了严格的质量控制,所以尽管纳入元分析的各项研究本身使用的方法不同,但是最后的分析结果依然显示出较好的稳定性。这是迄今为止针对本科STEM教育研究文献的一次规模最大和纬度最全的元分析。研究结果让我们对是否应该继续传统讲授的主导地位进行一定的质疑,并转向支持主动学习作为一种有效的教学方式,应作为日常课堂的首选。
自900多年前大学在西欧出现以来,讲授法始终是一种占据主导地位的教学模式。虽然强调学生对知识的理解进行自我建构的学习理论已经动摇了“讲即为教”的理论基础,但迄今为止依然没有一项研究针对建构主义教学方式与传统讲授教学对大学生科学、技术、工程和数学(以下简称STEM)学科成绩影响进行定量分析。因此,我们需要回答这一个问题:
在STEM的课堂上,我们究竟该“问”还是该“讲”?
如果教授STEM课程的科学家们对教学方式的选择更倾向于基于实际情况而不是传统,那么回答这个问题就变得顺理成章。同时,这个问题的答案还可能有助于为那些正在遭遇STEM教育“管道问题(pipeline problem)”的国家提供解决方案。例如,美国升入大学的学生中只有不足40%对STEM感兴趣,对STEM感兴趣的少数族裔学生中只有20%能够获得STEM方面的学位。
研究方法
为了比较建构主义与讲授为主课程设计在教学成效之间的差异,我们只专注于课程教学环节,而不把实验、作业或其他练习等纳入到研究范围之内。我们对已正式发表和未发表的225份文献进行元分析,比较这些文献在主动学习与传统讲授下对学生学习成绩进行比较的实验结果。
从强度和方法而言,不同的主动学习之间差异较大,种类繁多,其中包括小组问题解决、课堂工作(worksheet)或导师小组辅导的使用,有或没有同伴指导、个人反馈系统,以及工作室或工作坊形式等。
我们遵循定量评估的最佳实践,使用两个结果变量评估学生表现:(1)考试成绩,即同一或同等的考试、概念测试或其他评估的成绩分数;(2)不合格率,通常以成绩为D或F的学生,以及因各种问题退学的学生占全体学生数的百分比(DFW率)。
然后,分析聚焦于两个相关问题:主动学习提高考试成绩了吗?降低不合格率了吗?
结论
在同一或同等的考试、概念测试和其他评估中,总体平均效应值是0.47(Z = 9.781,P <0.001)的加权标准均数差。这意味着平均而言,主动学习与讲授教学相比,不足半个标准差的学生成绩获得了提升。不合格率的总体平均效应值是1.95比值比(Z = 10.4,P << 0.001),相当于1.5的风险率(Risk Ratio)。这意味着传统讲授方式下学生不合格的概率比主动学习方式高1.5倍。主动学习方式的平均不合格率为21.8%,传统讲授方式为33.8%。相较而言,传统讲授方式的不合格率高出55%(图1和图S1)。
图1. 不合格率变化。(A)表示针对同一门课程,主动学习与传统讲授下不合格率的百分比变化。垂直虚线表示平均不合格率的变化百分比。(B)图表示主动学习和传统讲授方式下不合格率的核密度估计。垂直虚线分布代表两种方式的平均不合格率。传统讲授为33.8%,主动学习为21.8%。
影响
总统科学技术顾问委员会要求增加33%STEM专业的本科毕业生,并向推荐院校采用经过实证研究验证的教学方法作为实现该目标的关键手段。本文的元分析研究结果表明,主动学习能够使考试成绩提高1.5个等级,传统讲授下的不合格率比主动学习的不合格率高55%。元分析支持这样的理论,即通过增加主动学习,减少传统讲授方式,可以一定程度上增加获得STEM学位的学生数量。
异质性分析(研究间的差异不能差异太大啦~)显示,无论对于考试分数(图2A; Q = 910.537,df = 7,P = 0.160),还是不合格率(图2B Q = 11.73,df = 6,P = 0.068),STEM学科考试之间没有统计学意义上的显著差异。在每个学科都有超过10次考试符合元分析的入选标准,平均效应值对于考试分数或不合格率在统计学意义上都是显著的。(图2,图S2和S3以及表S1A和S2A)。 因此,数据表明主动学习提高了STEM各学科的学生成绩。
图2.不同学科的效应值(A)考试分数、概念测试或其他评估数据。(B)不合格率数据。 数据点下面的数字表示独立研究的数量; 水平线是95%置信区间。
对于考试和其他评估的数据,异质性分析表明,当结果变量是由教师命题的考试时,学生成绩表现的平均效应值比概念测试题库检测时低。(图3A和表S1B; Q = 10.731,df = 1,P << 0.001)。尽管在上述两类评估中,学生学习成绩都有提升,但我们推断两者的差异可能是由于考试成绩与概念测试检测的认知能力水平不同造成的。
我们的解释与先前的研究结论一致,即主动学习对学生掌握较高水平的认知技能会产生更大的积极影响。研究认为大多数概念测试设计用于诊断学习者对已知概念的错误理解,而课程考试则强调对内容的熟练掌握,或解决定量分析题的能力。大多数概念测试也经过效度、信度和易读性的检测。
对于考试和其他评估的数据,异质性分析表明,当结果变量是由教师命题的考试时,学生成绩表现的平均效应值比概念测试题库检测时低。(图3A和表S1B; Q = 10.731,df = 1,P << 0.001)。尽管在上述两类评估中,学生学习成绩都有提升,但我们推断两者的差异可能是由于考试成绩与概念测试检测的认知能力水平不同造成的。
我们的解释与先前的研究结论一致,即主动学习对学生掌握较高水平的认知技能会产生更大的积极影响。研究认为大多数概念测试设计用于诊断学习者对已知概念的错误理解,而课程考试则强调对内容的熟练掌握,或解决定量分析题的能力。大多数概念测试也经过效度、信度和易读性的检测。
异质性分析显示,课堂规模会对结果产生显著差异。主动学习对学生数量为50名及以下的班级影响最大(如图3B和表S1C; Q = 6.726,df = 2,P = 0.035;图S4)。然而,效应值也显示主动学习对所有三种规模的班级影响具有显著性,即能够让中等班级(51-110名学生)或大班规模(> 110名学生)的学生受益。
图3. 关于考试成绩,概念清单或其他评估数据的异质性分析。(A)基于评估类型进行比较:概念理解与课程考试考试对比。 (B)按班级规模进行比较。 数据下面的数字表示独立研究的数量; 水平线是95%置信区间。
当围绕课程类型和课程水平纬度进行数据元分析时,我们发现无论对于主修与辅修课程(Q= 0.045, df = 1, P = 0.883; Table S1D),入门课程与高阶课程而言(Q = 0.046, df = 1, P = 0.829; Tables S1E and S2D),主动学习的效应值并没有统计学意义上的显著差异。
为了评估研究者对于这些结论的信心,我们实施了两种评估发表偏倚的方法。发表偏倚即因为低效应值的研究未能发表而产生的影响。第一种方法是计算Fail-Safe值用于了解有多少效应值为0的研究应该发表,纳入到元分析中,从而将总体效应值(0.47考试成绩和1.95不合格率)降到预设的显著水平(0.20和1.1)。Fail-Safe N很高:114项考试成绩研究和438项不合格率研究(SI材料与方法)。第二种方法为漏斗图的分析(图S5),结果也表明不具备发表偏倚(SI材料和方法)。
元分析在方法上存在的缺陷可能会造成本次研究中采用的STEM教育文献难以支撑对研究结论的解释。为此,我们需要检查考试成绩数据效应值中的异质性,即考察考试成绩数据是否符合我们最严格学生和教师的一致性标准。我们创建四个类别来区分主动学习与讲授教学(SI材料和方法)对学生一致性的质量控制情况,经过分析发现在方法没有异质性(Q = 2.097,df = 3,P = 0.553):学生被随机分配的考试,与其他三种准设计是一致的(表1)。
对教师的差异分析也没有产生异质性的证据(Q = 0.007,df = 1,P = 0.934):对于教师变量控制不良的情况,即两个试验组中教师不同,或者无法提供教师一致性数据时,生成的结果与在两个试验组中采用相同教师或随机安排教师的情况下生成的结果是等同的(表1)。因此,整体效应值对于已发表研究在方法严谨性上的差异而言是稳定的。
讨论
本项研究数据表明,主动学习方式下近标准差一半的学生考试成绩获得提高,而讲授教学方式下不合格率则提高了55%。异质性分析表明,(1)成绩上升的情况在所有STEM学科,不同的班级规模、课程类型和课程水平都会发生;(2)主动学习在小班规模和概念测试情况下学生成绩增加得更多。
作为迄今为止采集本科STEM教育文献最大最全面的元分析,本研究的加权总平均效应值为0.47,几乎与之前公布的针对传统讲授方式对本科STEM课程影响的元分析结果0.50和0.51的加权平均效应值相差不多。因此,我们的结果与其他研究人员的调查结果是一致的。
然而,本研究所得出的总平均效应值会受到选取研究对象质量的限制。例如,因为学困生比学优生更有可能放弃课程,所以研究中所记录的主动学习方式下退学率的降低应该会降低评估的平均分——这意味着效应值为0.47的考试和概念测试评分可能低估了迄今所进行的研究中主动学习的实际影响(SI材料和方法)。
相反,如果主动学习方式得到普及,那么这样大小的效应值是否还会出现就不确定了。在这些研究中实施积极学习的教师都是志愿者。如果所有教师都被要求采用主动学习方式教学,那么学生成绩是否会提升这么多,就将成为一个没有确定答案的开放性问题。
假设其他教师也都实施了主动学习方式,并且达到前面所说的平均效应值,那么考试和概念测试得分发生的0.47的标准差变化,对学生来说意味着什么呢?
(1)在传统讲授模式下如果学生表现处于50%的位置,那么在主动学习方式下将提升至68%——也就是一名学生的成绩比50%的同班同学成绩高,而在接受主动学习方式后,将比68%接受讲授教学学生成绩高。
(2)根据对三门STEM入门课程的考试成绩分析(SI材料和方法),0.47标准差的变化将带来学生平均考试成绩增加约6%,并使最终平均等级提升0.3%。在字母等级评价系统中,课程考试成绩的中位数将从B-升至B或从B升至B +。另外,针对主动学习对本科STEM课程成绩结果的影响也可以与大学值前的教育情况进行比较。最近一项针对K-12进行教育干预的文献研究报告,在研究者自己命题测量主动学习的影响时,平均效应值为0.39,与本文的分析结论相近;而在狭义标准化测试中,平均效应值为0.24 ,与本文概念测试结论相似。因此,本科阶段主动学习的效应值比大于K-12中采取教育创新产生的效应值,而对效应值为0.20甚至更小情况,可被视为政策利益导致的.
对于STEM课程1.95的比值比的失败风险,我们至少有两种视角来看:
i) 如果试验是按照药物干预的随机对照试验来操作,那么会因为对患者利益的考虑而终止试验。因为与对照组相比,试验组的收益太明显了,所以就会终止控制组的入选患者参与试验。例如,最近一项对143例随机对照药物试验就因为患者的利益中途终止了。因为,试验发现他们的相对危险度中位数为0.52,范围为0.22至0.66(15)。此外,最佳实践表明,如果临时分析涉及大规模样本量,且P值低于0.001(16),那么数据管理委员会允许此类研究因为患者利益问题终止。我们分析的这一教育领域研究的失败率结果均符合这两个标准:平均相对风险为0.64,整体比值比的P值为0.001。然而,任何与生物医学试验研究类比的研究均是合格的,因为涉及失败率数据的研究均缺乏随机化的设计。
ii)关于不合格率的数据涉及67项讲授教学试验研究和29,300名学生。对于该样本,传统讲授方式下的原始不合格率平均为33.8%,主动学习方式下为21.8%,这就意味着主动学习下这些STEM课程中不合格的人数会减少3,516人。基于保守估计(SI材料和方法),如果所有的学生都接受了主动学习,那么将为学生节约3,500,000美元的学费。鉴于2010年美国高校招收的2100万学生中大约三分之一计划选择STEM专业,如果主动学习得到广泛实施,那么节省的总学费将多达百倍。最后,提高成绩和减少不合格将对“管道问题”的解决产生重大影响。例如,2012年总统科学技术顾问委员会的报告要求在未来十年内在美国增加一百万个STEM相关专业,这就需要从现在开始每年增加33%,并请注意单将现在的STEM保留率从40%增至50%,就可以实现该目标的四分之三。
根据国家教育统计中心最近的一项队列研究(cohort study)数据表明,在STEM课程的一年级本科和副学士学位中选择放弃的学生和继续学业的学生之间的STEM课程平均分(GPA)之差分别为0.5和0.4。主动学习产生的0.3的平均成绩提升,能够让选择放弃的学生接近继续学习学生的成绩水平。针对放弃STEM专业的学生的其他分析表明,通过率提高、成绩提高和课程中的参与度都会在增加学生继续学习STEM方面发挥积极作用。
本项研究除了证明主动学习可以改善本科STEM教育外,对未来的后续研究也具有重要意义。这次元分析可以视为针对大学生STEM教育的第一代研究,研究人员侧重于将多种不同方式和不同强度的主动学习方式与传统讲授教学进行对比。鉴于研究结果,在后续的试验中继续将传统讲座作为对照组就值得商榷了。
相反,如果将研究重点放在我们称之为“第二代研究”上可能会更富成果。所谓第二代研究就是使用教育心理学和认知科学的研究成果来促进课程设计的变化,然后检测何种主动学习对何种话题或何类学生是最恰当和最有效的。第二代研究还可以深入探索,主动学习中哪些教师行为对于取得最好的学习效果影响最大,而且最近的研究工作表明准备不足的和易被忽略的学生可能从主动学习方法中获益大。
此外,主动学习强度是“多就是好”这一问题的解决也很重要。虽然本研究中主动学习所需投入的时间差异较大,从只占10-15%上课时间的选择题练习,到整节课都没有讲授的“工作室”都有。然而,由于缺乏数据我们无法评估主动学习强度(或类型)和学生表现之间的关系。
随着研究持续深入,我们预期第二代研究对课程设计产生的影响,将进一步提升学生的学业成就,特别是对课内主动学习干预措施类型与课外练习有机融合起来效果会更好。
最后,更多数据表明STEM的教师可能会开始对日常教学中继续使用传统讲授进行质疑,特别是当他们关注到最近研究表明主动学习能够让家庭背景不佳的学生,或让在男性主导领域中的女生更大程度获益时。尽管在相当长的时间内,传统讲授依然会在大学本科教学中占据主导地位,而且拥护者众多,但是显在有证据支持的建构主义者“提问,而非讲授”的方法可能促进学生成绩的强劲增长,会推动了政策制定者和研究人员更加积极的呼吁,为正在改变本科STEM课程教学的教师们提供支持。
免责声明:文章源于网络,版权归原作者所有,如有侵权请及时联系删除,谢谢!
--end--
声明:本文章由网友投稿作为教育分享用途,如有侵权原作者可通过邮件及时和我们联系删除:freemanzk@qq.com