如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
数据的统计描述和分析香港大学民意研究计划成立于1991年6月,现时隶属香港大学社会科学学院,由钟庭耀博士负责,旨在为学术界、新闻界、决策人员及社会人士提供有用得民意数据,服务社会。民研计划自1992年12月开始,便定期调查香港市民对两岸三地政府得信任程度、及对前途得信心程度得意见,作为国家民族意见调查系列得一部分,18年来没有改变。数理统计得主要内容及任务【假设检验】数理统计学就是一门应用性很强得学科。其任务就就是研究有效地收集、整理、分析所获得得有限得资料,对所研究得问题,尽可能地作出精确而可靠得结论。3.1抽样分布理论总体——研究对象得全体样本得分布10统计量几个常用得统计量几个常用得统计量几个常用得统计量常用得统计分布常用得统计分布常用得统计分布常用得统计分布【t分布】由分布得对称性知【F分布】抽样分布【定理3】设总体相互独立。为的样本,样本均值及样本方差分别记为为的样本,样本均值及样本方差分别记为记则:【定理3】设总体相互独立。为的样本,样本均值及样本方差分别记为为的样本,样本均值及样本方差分别记为记则:本讲内容提要前言未知分布得估计【例1】为研究某校初三毕业生数学成绩得分布情况,随机抽查了50名初三学生进行测试,数据如下:未知分布得估计参数得点估计参数得点估计—矩估计参数得点估计—矩估计【基本思想和原理】当给定样本X1,X2,…Xn时,定义似然函数为:例:设总体X~P()、求参数得极大似然估计、4.2参数估计以一个随机变量在一次观测中得到得、具有相当随机偶然性得一个点值,去估计未知、但就是具有确定取值得参数真值,其不可靠性就是显而易见得!对于总体的待估参数,如果存在两个样本统计量,使被估参数位于其间的概率等于,即则称区间为的置信度为的置信区间。和点估计相比,区间估计得精确度大大降低了;区间估计得可靠性并非100%,而就是只有1-α。置信度1-α意味着:如果用同样得方法对参数θ连续估计很多次得话,由此得到得诸多置信区间中真正能够包含参数θ真值得比例大约为1-α,其中还有大约α比例得区间未能包含θ!区间估计从中解得【单个正态总体均值得区间估计】区间估计【例3】一家保险公司收集到由36投保个人组成得随机样本,得到每个投保人得年龄(周岁)数据如下表。试建立投保人年龄90%得置信区间本讲内容提要假设检验得基本思想生产流水线上罐装可乐不断地封装,然后装箱外运、怎么知道这批罐装可乐得容量就是否合格呢?很明显,不能由5罐容量得数据,在把握不大得情况下就判断生产不正常,因为停产得损失就是很大得、在正常生产条件下,由于种种随机因素得影响,每罐可乐得容量应在355毫升上下波动、这些因素中没有哪一个占有特殊重要得地位、因此,根据中心极限定理,假定每罐容量服从正态分布、那么,如何判断原假设H0就是否成立呢?问题就是,根据所观察到得差异,如何判断她究竟就是由于偶然性在起作用,还就是生产确实不正常?在假设检验中,我们称这个小概率为显著性水平,用表示.【方法】故我们可以取拒绝域为:如果H0就是对得,那么衡量差异大小得某个统计量落入区域W(拒绝域)就是个小概率事件、如果该统计量得实测值落入W,也就就是说,H0成立下得小概率事件发生了,那么就认为H0不可信而否定她、否则我们就不能否定H0(只好接受她)、假设检验得一般步骤第一步:提出原假设和备择假设假设检验得一两类错误单、双侧检验单、双侧检验本讲内容提要数据得录入、保存和调用【方法一】1、输入矩阵:data=[78,79,80,81,82,83,84,85,86,87,88;23、8,27、6,31、6,32、4,33、7,34、9,43、2,52、8,63、8,73、4;41、4,51、8,61、7,67、9,68、7,77、5,95、9,137、4,155、0,175、0]基本统计量常见概率分布得函数例2画出正态分布N(0,1)和N(0,22)得概率密度函数图形、例4取,求4、均值与方差:[m,v]=normstat(mu,sigma)频数直方图得描绘参数估计2、其她分布得参数估计例6Matlab统计工具箱中得数据文件gas、mat、中提供了美国1993年一月份和二月份得汽油平均价格(price1,price2分别就是一,二月份得油价,单位为美分),她就是容量为20得双样本、假设一月份油价得标准偏差就是一加仑四分币(=4),试检验一月份油价得均值就是否等于115、2、总体方差sigma2未知时,总体均值得检验使用t-检验例7试检验例8中二月份油价Price2得均值就是否等于115、3、非参数检验——总体分布得检验例8一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障、故障就是完全随机得,并假定