常用质量统计技术.ppt
上传人:书錦****by 上传时间:2024-09-10 格式:PPT 页数:66 大小:4.9MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

常用质量统计技术.ppt

常用质量统计技术.ppt

预览

免费试读已结束,剩余 56 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

常用质量统计技术-转训培训大纲:统计随机变量随机变量(数据)的分类:1、连续型数据(计量数据)所有可能取值充满数轴上一个区间,如腔体温度、压力、薄膜厚度、图形高度等2、离散型数据(计数数据)数值取值数轴上有限个点或可列个点,如抛硬币出现的面、掷塞子出现的点数、备件的不同材质、材料的不同厂家、不同的外延炉、一批制品的异常数等。总体和样本统计量离散型随机变量分布几个常见离散型分布几个常见离散型分布几个常见离散型分布连续型随机变量分布概率密度函数p(x)的特征:连续型随机变量F(X≤x)的概率:连续型随机变量在某个区间内取值的概率:正态分布:正态分布的特点:正态分布的特点:正态分布的特点:标准正态分布:μ=0,σ=1正态分布X和标准正态分布Z的关系:我们称之为“一般正态随机变量的标准式”标准式的应用举例:某外延机台生产的外延片,片间平均波长是467nm,标准差为1.2nm,求该机台生产的外延片波长小于464nm的概率?解:波长服从正态分布X~N(467,1.22),将其转化为标准正态分布后为:P(X<464)=P(U<(464-467)/1.2)=P(-2.5)=1-P(2.5),查询《标准正态分布函数表》得P(2.5)=0.99379,即P(X<464)=1-99.379%=0.621%中心极限定理:中心极限定理:有关正态总体的几个重要的抽样分布:有关正态总体的几个重要的抽样分布:有关正态总体的几个重要的抽样分布:研究数据的分布有什么用?统计推断!统计推断:指利用有限的样本数据对总体未知的重要信息(如:均值、方差和标准差等)进行合理判断和估计。常用的统计推断方法有参数估计和假设检验:1、参数估计:指应用有限的样本数据对总体未知的重要信息(如:均值、方差和标准差等)进行合理估计,包括:点估计和区间估计。在一定的置信度下,估计参数的范围叫置信区间。2、假设检验:指应用有限的样本数据对总体未知的重要信息(如:均值、方差和标准差等)进行合理判断。参数估计正态总体参数的点估计:例、点估计:在我们生产衬底过程中,需要对SiO2掩膜的直径进行监控,某一次加工了500片衬底半成品,随机抽取20片进行SiO2直径的测量,我们将用抽测的这20片的直径计算出样本的均值和标准差,并以此来代表这500片的均值和标准差。这就是统计学上常说的点估计,即利用样本数据的结果,给出总体均值、总体方差、总体标准差等的估计数值。区间估计:区间估计:既然是借助有限的样本数据估计总体,就不可避免地会有估计的风险,所以,不可能得到100%把握下的结论。实际工作中,往往是在95%把握下,对总体参数所在的区间的估计,已经足以满足管理和控制的需求。这样估计得到的区间,称为置信区间,这种估计方法在统计上成为区间估计。区间估计:正态总体参数的1-α置信区间:例、区间估计:假设检验从样本区推断假设是否成立:假设检验的基本步骤:正态总体的常见假设检验模型:例、假设检验:仍然以500片PSS衬底半成品为例,借助随机抽取的20个样品来推断该批衬底的SiO2直径均值。我们的生产目标是SiO2直径为1.7um。根据我们抽测的情况,可否认为该批衬底的SiO2直径就是1.7um?运用假设检验,做出我们的判断。假设检验的步骤如下:步骤1:设计零假设和备择假设,即H0:μ=1.7,H1:μ≠1.7。步骤2:我们抽测的这20片制品的样本均值x=1.701,标准差s=0.0276,样本量n=20.步骤3:确定假设检验的显著性水平为α=5%,基于抽测的样本均值、标准差有:=(1.701-1.7)/(0.0276/)=0.162例、假设检验:假设检验的用途:方差分析:假定:在同一水平下,产品特性值有一个理论上的均值,实际观测数据对理论均值的偏离是随机误差,这个误差一般服从正态分布。不同水平下,这些均值上的差异是由不同水平造成的,是系统误差。除了已知因素以外的其他因素尽可能保持一致,因此可以认为不同水平下对应的总体方差相同。这样,问题就变为:对于多个均值不同,方差相同的正态总体,推断因子对指标的影响是否显著的问题,等价于推断多个方差相同的正态总体,均值是否相等的问题。三个条件:独立、正态、等方差如果在不同水平下,组间的差异(系统误差)与组内的差异(随机误差)相差不大,那么可认为不同水平下,产品特性值没有显著差异。反之,如果在不同水平下,组间的差异与组内的差异相比,差别较大,那么这种差异就很难用随机误差来解释,只能认为是由于水平的不同(系统误差)这个原因造成的。r:因子水平数;m:结果组数;方差分析:鉴于学习程度和实际操作经验有限,在此只能简单给出理论分析过程