2018-2019学年人教B版 选修1-2 独立性检验的基本思想及其初步应用(一) 教案
2018-2019学年人教B版  选修1-2 独立性检验的基本思想及其初步应用(一) 教案第2页

一、 引入

从问题"吸烟是否与患肺癌有关系"引出独立性检验的问题并借助样本数据的列联表,柱形图,和条形图的展示,使学生直观感觉到吸烟和患肺癌可能会有关系。但这种结论能否推广到总体呢?要回答这个问题,就必须借助于统计理论来分析。

二、独立性检验就是检验两个分类变量是否有关的一种统计方法用字母表示吸烟与患肺癌的列联表:

不患肺癌

患肺癌

合计

不吸烟

a

b a+b

吸烟

c d C+d 合计

a+c b+d a+b+c+d 样本容量 n=a+b+c+d

假设H0: 吸烟与患肺癌没有关系。则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:

,因此,的绝对值越小,说明吸烟与肺癌之间的关系越弱,构造随机变量:其中,若H成立,则K应该很小. 把表中数据代入公式

,在H成立的情况下.统计学家估算出如下概率PK0.01即在H成立的情况下,K的值大于6.635的概率非常小.如果K6.635,就断定H不成立,出错的可能性有多大?出现K=56.6326.635 的概率不超过1% .因此,我们有99%的把握认为"吸烟与患肺癌有关系.."但这种判断会犯错,犯错错误的概率不会超过0.010,在上述过程中,实际是借助于随机变量k2的观测值k,建立了一个判断H0是否成立的规则。

如果k>=6.635,就判断H0不成立,即认为"吸烟与患肺癌没有关系"

在该规则下,把结论h0错判成H0不成立的概率不会超过P(K2>=)=0.010这里计算的前提是H0成立。上面解决问题的想法类似于反正法,要判断"两个分类变量有关系",首现假设该结论不成立。即H0:两个变量没有关系成立,在该假设下我们所构造的随机变量K2应该很小,如果由观测值数据计算得到的K2的观测值k很大,则断言H0不成立即认为"两个分类变量有关系";如果观测值k很小,则说明在样本数据组没有发现足够理由拒绝H0。怎么样判断K2的观测值k是大还是小?这仅需要一个确定的整数k0,当k>=k0时就认为K2的观测值k大。此时相应于k0的判断规则:如果k>=k0,就认为"两个分类变量有关系";否则就认为"两个分类变量没有关系",我们称这样的一个k0为临界值。

上述利用随机变量K2判断"两个随机分类变量有关系"的方法称为独立性检验 学做思一:独立性检验原理

列联表:列出两个变量的频数表。解决问题的想法类似于反正法,要判断"两个分类变量有关系",首现假设该结论不成立。

即H0:两个变量没有关系成立,在该假设下我们所构造的随机变量K2应该很小,如果由观测值数据计算得到的K2的观测值k很大,则断言H0不成立即认为"两个分类变量有关系";如果观测值k很小,则说明在样本数据组没有发现足够理由拒绝H0。怎么样判断K2的观测值k是大还是小?这仅需要一个确定的整数k0,当k>=k0时就认为K2的观测值k大。此时相应于k0的判断规则:如果k>=k0,就认为"两个分类变量有关系";否则就认为"两个分类变量没有关系",我们称这样的一个k0为临界值。

上述利用随机变量K2判断"两个随机分类变量有关系"的方法称为独立性检验

学做思二:师生互动

例题示范:在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,利用图形判断秃顶与患心脏病是否有关系?能否在犯错误的概率不超过0.0.0的前提下认为秃顶与患心脏病有关系?

解答:

患心脏病 换其他病 总计 秃顶 214 175 389 不秃顶 451 597 1048 总计 665 772 1437 计算得k=16.373>6.635

因此,在犯错误概率不超过0.010的前提下,认为秃顶与患心脏病有关系。

学做思三:思考总结

反证法原理与独立性检验原理的比较

反证法原理 在假设H0下,如果推出一个矛盾,就证明了H0不成了 独立性检验原理 在假设H0下,如果推出了一个与H0相矛盾的小概率事件,就推断H0不成立,且该推论犯错误的概率不超过这个小概率。 教材P15页,练习 独立性检验的条件假设和原理