本文来源于网络,我整理了一下,这篇文章很值得学习!
在高中数学课纲之机率统计新教材中, 其课程设计和教材编写不但忽视学生的认知, 甚至在教科书上仍然存在一些错误的概念。 例如, 在介绍二项分配前对超几何分配只字不提, 导致优秀学生把简单的超几何分配问题利用二项分配来处理, 教师在课堂教学时如何改进这项缺失? 其次, 在提到中央极限定理的时候, 每本教科书都指出它是非常重要的定理, 但却又认为超出高中范围不宜多作说明, 难道就没有通俗简单的方式让学生理解吗? 至于错误的观念部分, 有些教科书将信心水准定义为母体百分比 p 会落在信赖区间的机率。这种错误之统计概念竟然会出现在经过审核的教科书上, 也难怪在学测中一道有关信心水准的试题,不但学生看了以后感到一头雾水, 甚至连老师都不知道要如何选择正确答案。虽然到目前为止数学教育研究还没有建立一套标准, 但经过各方讨论初步有一点已达成共识, 那就是: 数学教育研究必须走进课堂解决教与学的实际问题。本文将透过台北市一所高中在课堂中进行实际教学, 针对以上的缺失与错误尽量用通俗易懂的方式提出解决之道, 以提供给有兴趣的学生与教师作为参考与改进的依据, 以嘉惠于广大青年学子为幸。
一. 超几何分配与二项分配的关系
笔者翻遍高中教科书的机率统计内容, 发现每一本都只提到二项分配, 而对于更简单的超几何分配却只字不提。 或许有学者会认为在实务上所面临超几何分配可被二项分配作极佳的逼近, 但站在基础数学教育的观点是不能这样处理的, 就像常态分配可以很好的近似于二项分配, 难道我们也不需要学习二项分配了吗? 为了暸解新教材的这种内容安排对学生有什么影向, 笔者曾经对学过高三机率统计的自然组学生提出下列问题:
年终为了替孤儿院的孩子募集压岁钱, 百货公司印制了100张彩券义卖, 已知彩券中50% 是有奖品的。今某人购买了3张彩券, 问恰有2张中奖之机率 ==?
在全班48人的答案中, 有39人之答案为, 有6人答案为
有2人计算出其他答案, 有1人空白未予以作答。 本题从调查资料结果显示, 竟然有高达 81% 学生直观的将之视为二项分配问题, 研究中为了进一步追踪比较不同程度的学生反应, 又再度对已学过高三机率统计的社会组学生, 在一份问卷中同时提出下列两个问题:
1. 年终为了替孤儿院的孩子募集压岁钱, 百货公司印制了一批彩券义卖。己知彩券中50%是有奖品的。今某人购买了3张彩券, 问恰有2张中奖之机率 ==?
2. 年终为了替孤儿院的孩子募集压岁钱, 百货公司印制了100张彩券义卖, 已知彩券中 50% 是有奖品的。今某人购买了3张彩券, 问恰有2张中奖之 机率 =?
班上32人答案中, 第一题有31人答案为,
有1人之答案为
第二题有19人的答案为, 有12人的答案为 , 有1人空白未予以作答。从这两次的问卷结果可以看出, 把两个不同问题同时并列提出让学生作答, 对于一般平均数学程度较差的社会组, 有大约 38% 学生意识到两个问题的差异性, 转而更仔细的去思考问题的意义, 因而做出了较高比率的正确答案, 使得藉由直观所产生的错误降为 59%。 由此可以证实教学过程中之问题经由适当的设计, 确实可以降低学生在学习机率概念的一些直观错误。
上述所提两个问题其实就是二项分配 (Binomial distribution) 与超几何分配 (Hypergeometic distribution) 的概念, 从问卷结果中显示它们是学生极易产生混淆的两个观念。 为了厘清这两种分配所呈现问题的差异, 教学时笔者采取了鹰架教学 (Scaffolding instruction) 的方法, 让学生透过师生对话讨论出正确的想法。 课堂上提出下列问题与学生作对话式讨论:
百货公司年终印制彩券义卖, 已知彩券中有一半是有奖品的, 请问购买3张有2张中奖之机率 ==?
学生A: 买3张有2张中奖之机率。
学生B: 我认为不能确定其机率, 因为我们根本不知道公司印了几张彩券?
学生C: 凭直觉我认为不管印几张都没关系, 每种情况中奖机率应该都是 。
学生D: 若印4张彩券时, 买3张恰中2张之机率 , 若印6张彩券时, 买3张恰中2张之机率, 所以我赞成B同学的想法。
笔者: 既然我们不知道彩券印几张, 那同学不妨假设印了 张, 再计算取3张恰中2张的机率看看嘛!
学生D: 照老师的讲法从 张中取 3 张恰中 2 张之机率, 会随着 不同而得到不同答案。
笔者: 同学想一想当 nn 趋近于无限大时, 你们有没有发现 的值会趋近于多少呢?
学生A: 好奇怪喔!, 答案竟然跟我利用一样耶!
至此, 学生已经开始慢慢体会出本题已不是单纯的二项分配问题。 由于考虑学生相关先备知识 (Preknowledge)之不足, 在证明超几何分配与二项分配关系前, 笔者先提出下面基本问题让学生作为比较其差异性的鹰架:
袋中有红球6个和白球3个, 今由袋中每次任取一球, 请问 (1) 在取后不放回的情况下, 连取 5 次得 3 红球之机率 ==? (2)在取后又放回的情况下, 连取 5 次得 3 红球之机率 ==?
这时有学生求出情形(1)的机率,笔者告诉学生取后不放回,使得每次取到红球或白球之机率不恒相同, 这种机率模型称为超几何分配 (Hypergeometic distribution), 超几何分配之每次试验并非独立。也有学生求出情形(2)的机率 , 笔者此时特别强调取后再放回可视为袋中有无限多个球, 使得每次取到红球之机率恒
为 而取到白球之机率恒为 , 这种机率模型为二项分配 (Binomial distribution), 二项分配之每次试验都是独立的。
经过上面一连串的讨论与说明之后, 才正式提出两种机率分配的定义, 并证明超几何分配之极限是二项分配的事实(丁村成, 1997)。
1. 若 N件产品中有 M 件不良品, 在取后不放回的情形下, 则取 件恰有 件不良品之机率 , 此为超几何分配 (Hypergeometic distribution)。
2.若 N 件产品中有 M 件不良品, 在取后又放回的情形下, 则取 件恰有 件不良品之机率,此为二项分配 (Binomial distribution)。
底下进一步向学生证明 : 当 时
当 , 固定时因为
而且
因此得到当时
最后, 笔者举了一道生活中的应用问题, 让学生瞭解上述结论在实际上的应用: 工厂之 1000个产品中的不良品比率为0.1, 从其中任意抽取 3 个产品出来,请问恰有一个不良品之机率 ==?
由超几何分配得其机率, 但产品的样本数量颇大而不易
计算, 若用二项分配近似于超几何分配, 可得其机率。因此, 可以看出在 NN 很大的情况下, 利用二项分配算出的机率与超几何分配非常接近。
二. 二项分配近似于常态分配之教学
自然界有许多事物的分布情形都有一个特征, 就是数值资料大多集中于其平均数附近, 而位在两个极端的资料数量并不多, 且它们都会均匀分布在平均数的左右两边。 例如: 某一地区居民的总收入, 某一学校学生之数学成绩 等等, 其分布曲线都是呈现单一高峰的左右对称曲线, 这种曲线称为常态曲线 (Normal curve)。常态曲线有一个最高点, 此点的横座标就是资料的平均数 , 曲线的左右两端会对称于 , 而资料的离散程度可以用标准差 描述。一般只要我们知道了平均数与标准差, 整个资料的常态曲线就完全被确定了, 其中的平均数决定了曲线的中心, 而标准差确定了曲线的形状。在统计上只要样本资料符合常态曲线, 这些样本分布在范围,,之比率大约为 68.3%、 95.4%、 99.7%, 我们称之为常态分配的经验法则 (Empirical rule), 亦即约有 68.3% 的资料会落在距平均数一个标准差内; 约有 95.4% 的资料会落在距离平均数两个标准差内; 约有99.7% 的资料会落在距平均数三个标准差内, 如下图。
在 1733 年棣美弗 (De Moivre) 首先由二项分配 (Bionomial distribution) 的逼近推出了常态分配 (Normal distribution) 之表达式 (王幼军, 2007)。
但他当时二项逼近的工作并未引起人们的重视, 使得常态分配也仅停留于数学表达的层面, 在实际应用中也没有找到适合存活的土壤。陈希孺认为, 棣美弗本人并不是一位统计学家, 他并未从统计学的观点去考虑这项逼近工作的意义, 其出发点仅把 pp 作为已知数去研究如何用二项分配逼近常态分配, 而不是将 pp 看作未知数并通过观察结果对它进行推论 (陈希孺, 2005)。 因此, 在 棣美弗时代要使常态分配成为一种机率模型的时机尚不成熟, 但他对二项分配与常态分配的研究成果让中央极限定理之发展有着承先启后的作用。 正是在此基础上拉普拉斯 (Laplace)于1780年对棣美弗的结果进行推广, 并建立了棣美弗−−拉普拉斯极限定理 (De Moivre-Laplace Limit Theorem)(Hald, 1998)。 进入十八世纪数学出现一个很重要的特征, 那就是数学研究的目标在于处理人类碰到之实际问题, 生活中无论对自然现象或社会现象进行观测, 总会产生误差这一点在很早以前人们就注意到了, 但是对于其观测值所呈现的随机性人们却认识模糊。 虽然历史上有很多天文学家和数学家曾对误差理论作过研究, 但都没有从棣美弗的着作中得到任何有关常态分配的启发。 直到1809年高斯(Gauss)在研究测量误差之机率分配时, 才让棣美弗所发表的常态分配表达式得到了机率分配的身份, 又因高斯对常态分配所作的研究对后世的影向极大, 使得后人对于常态分配又有高斯分配的称呼 (Hald, 1998)。 德国10马克的纸钞上曾印有高斯肖像与常态分配的图案, 这表示数学王子高斯一生中在科学上, 对于全人类最大的贡献就是常态分配。
在二项分配近似于常态分配的高中教材中, 有教科书是利用投均匀硬币20次中会出现几次正面, 然后让全班每位同学投一硬币20次, 可能有人会掷出 8次正面也有人可能掷出12次正面, 如果将每人所掷出的正面次数记录下来, 那么这些次数之平均数就相当接近10次, 最后就直接得出结论: 机率里的期望值就是统计试验中大量数据的平均值。也有教科书先利用EXCEL计算二项分配再写一些连老师都看不下去的计算式子, 然后利用二项分配的期望值与标准差求比率 的 95% 信赖区间, 我真不知道编者有没有考虑到教与学之问题。 至于在教导高中学生的时候要如何来表达这个概念呢? 以下是个人在课堂中之教学片断, 首先介绍二项分配的期望值与标准差。
对于每次只有成功与失败两种结果的试验中, 若继续重复作 次试验且每次试验是独立的, 则在 次中恰有 次成功的机率为 , 这种机率分配我们称之为具有参数 的二项分配。在具有参数 的二项分配中若令 表示其成功次数, 则有下列结论:
1. X 的期望值 ,
2. X 的标准差。
证明如下:
因此我们得到
关于常态分配是二项分配的近似, 为了让学生很快的瞭解这个重要的概念, 笔者在上课中简单提出了一个 与 的例子说明如下:
一. 投掷一公正硬币 4 次, 令 X表示在 4 次试验出现的正面次数, 求P(X=k)=?
并作其二项分配机率图形如右:
由上面例题我们可以告诉学生, 当具有参数 (n,p) 之二项分配中的 n 足够大时 (n≥30)(n≥30), 它会近似于平均数 , 标准差 之常态分配, 课堂上只要对 逐渐增大加以说明或配合计算机模拟实验, 根据我的经验学生很容易接受这个事实。 此一观念是机率中计算繁琐二项机率的重要依据, 但由于其机率牵涉到近似的概念, 所以在评量学生问题的时候, 最好采选择型式并配合近似的观念来命题。例如: 投掷一枚不公正铜板72次, 其出现正面的机率为 , 则此硬币出现正面次数介于 16 次与 32 次之间的机率最接近下列何者? (A) 0.64 (B) 0.68 (C) 0.80 (D) 0.95 (E) 0.99
解: 令 表示出现正面之次数, 则出现正面次数介于 16∼∼32 次之机率为
这是一个非常繁琐的式子, 我们必须另谋其他方法求机率值。但当试验次数 n 足够大时二项分配会近似于常态分配, 本题出现正面的次数 X近似于 , 之常态分配, 因此可以得到其机率
有关二项分配近似于常态分配就是历史上的棣美弗−−拉普拉斯极限定理, 它告诉我们当二项分配的参数 足够大时, 可利用常态分配来求其近似值。此定理首先由棣美弗在1733年证明出 的情形, 后来才由拉普拉斯将其结果推广到一般的 , 其中 。 此定理叙述如下(丁村成, 1997):
De Moivre-Laplace Limit Theorem设 表示进行 n 次独立试验的成功次数, 且每次试验成功的机率为 , 则当 可得到
三. 中央极限定理通俗的表达方式
中央极限定理(Central Limit Theorem)是连接机率与统计之重要桥梁, 它指出: 从具有平均数 μ 与标准差 σ 的母体 (Population) 中随机取出 nn 个样本 , 当 n 足够大时的抽样分配会近似于平均数 μ 而标准差 之常态分配。 至于样本数 n 要多大才能使得常态分配给 之抽样分配提供更良好的近似呢? 其答案依赖于被抽样的母体而定, 但一般对于大多数母体取样本数 是足够的 (Mc Clave et al. 2008)。 目前的高中教科书介绍这个定理大都采取了计算机摸拟加以说明, 但这并无助于学生对此一重要定理的瞭解, 因为学生从计算机模拟中无法亲自体会 抽样分配之随机性。上课中为加深同学对 这个分配之个数及变化, 我特别设计了下面问题来说明。
从母体 0, 3, 6, 9, 12 中任意抽取三个样本, 求出所有可能样本平均数 之抽样分配并绘出其抽样分配机率图形为何?
首先可由 得知我们共可抽出十组不同的样本, 因此也会得到十种 的不同情形, 将之列表并计算每一组之 如下:
若将 按大小顺序排列可得到其对应的机率分配如下表:
因此, 可以绘出 抽样分配之机率图形于下:
此抽样分配 之平均数
若利用除以 的公式得 的标准差
这个例子不但可让学生瞭解 抽样分配的平均数与标准差不易求得, 亦可使他们体会到 抽样分配对于 n=3的情形已具有常态分配之趋向, 这就是给予中央极限定理很直观的视觉化 (Visualization) 表达方式
要证明 的平均数 与标准差 并不难, 因为
最后再提出中央极限定理的结论: 从具有平均数 μ及标准差 σ 之母体中随机取出 n 个样本, 当 n 足够大时样本平均数 的抽样分配会近似于平均数 μ 及标准差 之常态分配。 个人透过实际教学大部分学生都能清楚此定理的意义, 此一教法更有助于让学生正确掌握信心水准的观念。 至于比较一般的中央极限定理之形式如下(Ross, 2006):
The Central Limit TheoremLet be a sequence of independent and identically distributed random variables each having mean μμ and variance . Then the disrtibution of tends to the standard normal as. That is, for ,
这是拉普拉斯最早所提出的一般形式, 但他本人对此定理的证明并不十分严格。 真正严格的证明是李雅普诺夫(Lyapunov)在1901∼∼1902年之间所完成, 并在证明中首创利用了崭新的特征函数 (Characteristic function), 透过特征函数方法实现了机率分析的革新, 才使得机率中有关极限定理的证明得到更大的发展(Adams, 2009)。 中央极限定理早期的应用显示测量误差近似于常态分配, 这在科学上发展出很多非常重要的贡献, 所以十七世纪至十八世纪它通常被称为误差频率定律 (Law of frequency of errors)。 至于「The Central Limit Theorem」这个名称, 是由波利亚(Polya)于 1920 年在其博士论文中所提出的。
四. 信赖区间与信心水准之正确解读
在选举前有民调中心想要调查某位候选人的支持度, 最准确的方法当然是调查所有合格选民, 若在 N个会去投票者中有 M 个支持该候选人, 则其真正的支持度 即为母体支持率。 但是这样的调查方法往往耗费太多的人力与物力, 根据统计学一般会采取随机的方式进行抽样调查。 为估计未知的母体支持度 p, 民调中心随机抽取了一份 n 个人的样本, 若调查结果有 m 个人支持这位候选人, 则其样本之支持率 , 这只是对该候选人支持率的一个估计。如果重新随机再抽取 n 个人的样本, 由于组成另一个样本的人不一定与上次相同, 使得对该候选人的支持率也可能随之改变。因此, 在抽取 nn 个样本的抽样中可产生 组不同的样本, 则对该候选人的样本支持率 就可能有 不同变化, 其发生的机率分别列表如下:
因此可得到
根据中央极限定理当 nn 足够大时, 产生的分配会趋近于平均数 p 与标准差 之常态分配, 再由常态分配的经验法则可得知 值有大约95% 的比例会落在。 一般在抽样时我们并不知道母体真正值 p, 但当抽取样本数 n 足够大时, 每一组样本所产生的 都会近似于 p, 所以也可以利用 来估计 p, 我们称 为 p 的 95% 信赖区间 (Confidence interval)。 因为统计学家有某种程度的信心认为该区间会包含 p, 所以给它取名为信赖区间, 其理由是当我们收集了许多不同的样本, 并对每个样本都得到了一个信赖区间, 这些信赖区间有足够的信心使其中的 95% 包含了母体之真正值, 则 95% 这个值就被称为信心水准 (Confidence level)(Iversen, et al.~1997)。 95% 这个值在统计是比较常用的, 当然你也可以使用其他值 90% 或 99% 来作信心水准。
在大多数情况下, 调查人员收集数据时都只取一组样本, 可是没有人能够知道这组样本所产生的信赖区间是否包含 p。 至于这个区间是否包含 p 呢? 注意! 它只有两种答案, 即它包含 p 或不包含 p, 采用机率的观点来看就是或 0, 亦即信心水准 95% 并不是一个机率值, 所以不可以将之解读为真正 p 值会落在此信赖区间的机率是 0.95。 因此, 统计学上才假设做了足够多次抽样后, 借助其近似于常态分配的经验法则来探讨信心水准, 并创造出信赖区间这样的名词来描述它。我们之所以用这种拐弯抹角的表达方式, 其原因在于母体真正值是未知的固定数, 而抽样比率 所得到的信赖区间却是变动的, 若重复这个作法会得到一些不同的信赖区间, 在这个意义下信赖区间是一个随机区间, 此区间会随着所取样本的不同而不同。 一个区间就像为了捕获未知的 p 而撒出去的网, 并非每一次撒网的地点都能捕获真正值p。 因此, 信心水准 95% 的意义是多次抽样中大约有 95% 的信赖区间会包含未知的母体真正值 p, 或通俗的解读为我们大约有 95% 的「信心」 确定这次调查得到的信赖区间会包未知的母体真正值 p。在98年学测考试有一道题目:
某厂商委托民调机构在甲乙两地调查听过某项产品的居民占当地居民之百分比 (以下简称为「知名度」), 结果如下: 在 95% 信心水准之下, 该产品在甲、乙两地的知名度之信赖区间分别为 、。试问下列哪些选项是正确的? (1) 甲地本次的参访者中有54%的人听过该产品 (2) 此次民调在乙地的参访人数少于在甲地的参访人数 (3) 此次调查结果可解读为: 甲地全体居民中有一半以上的人听过该产品的机率大于 95% (4) 若在乙地以同样方式进行多次民调, 所得知名度有 95% 的机会落在区间 (5) 经密集广告宣传后在乙地再次进行民调, 并增加参访人数达原人数的四倍, 则在 95% 信心水准之下该产品的知名度之信赖区间宽度会减半。
本题大考中心公布的正确答案为选项(1)(2), 并统计全体考生答对率只有 7% 而鉴别度为 −0.01。 虽然题目在叙述上之用字遣词不是非常完美, 但个人对于这题的命题委员之用心表示钦佩, 因为他在选项(4)中点到了未知杀手 p, 也在选项 (5) 中考虑到了 的随机性。 如果学生未能瞭解 p 的未知性与 之随机性, 那就无法对这两个选项作出是否正确的判断, 这也是个人一再强调教师在使用中央极限定理之前, 必须对抽样分配 的随机性作一番解说, 才能让学生对于理解 的随机性有所帮助。 在目前各版本教科书对此观念都语焉不详的情况下, 我实在不敢指望学生能够瞭解选项(4)与(5)的意义。 笔者建议教师在课堂中将本题改成下面题目, 对于学生在理解此一概念会有更好的效果:
某厂商委托民调机构在甲地调查听过某项产品的居民占当地居民之百分比(以下简称为「知名度」), 其结果如下: 在 95%信心水准下该产品在甲地的知名度之信赖区间为 [0.50,0.58][0.50,0.58]。 试问下列哪些选项是正确的? (1) 此次调查在甲地参访者中有 54% 的人听过该产品, 且其抽样误差为正负 4 个百分点 (2) 此次调查有 95% 信心可确定甲地全体居民中, 听过该项产品的比率为会落在 0.50∼∼0.58 (3) 若在甲地再次进行民调并增加参访人数达原人数的四倍, 得到在 95% 信心水准下该产品知名度之信赖区间宽度会减半 (4) 若在甲地以同样方式进行多次民调, 所得到信赖区间中大约有 95% 会包含其真正的知名度 (5) 若在甲地以同样方式进行多次民调, 所得的知名度会落在其信赖区间之机会大约为 95%。
本题笔者设计其正确选项为(1)(2)(4)。切记! 计算机在数学教学上只是一种帮助瞭解与计算的辅助工具, 如果在教学的过程中处处依赖计算机而不深入思考, 根据数学教育一些相关研究结果已经表明, 这对于学习抽象与推理能力将是有害无益的, 这也是为什么有教科书赶时髦附上随机区间计算机模拟实验, 却又在书上写出「p 落在信赖区间的机率称为信心水准」这种不合理的定义了。在这次修订版的定义下虽加注了「信心水准与机率两者有不同涵义」, 却于同书241页又作了一些和此定义自相矛盾的说明, 令人不解与遗憾。)