如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
1.摘要空气质量问题始终是政府、环境保护部门和全国人民关注的热点问题。2016年的两会上,全国政协常委、环境保护部副部长吴晓青表示,政府工作报告中提出的今后五年地级市及以上城市空气质量优良天数比率超过80%的目标必须完成。其中,优良天数比率指的是:区域内城镇空气质量优良以上的监测天数占全年监测总天数的比例。针对此,我们小组刚好找到了浙江舟山的相关数据,AQI指数与影响空气质量的污染物(PM2.5、PM10、CO、NO2、SO2)并用matlab对此进行分析。关键词:多元线性回归模型;散点图;层次分析;残差分析;相关性分析针对按照常识,空气污染指数随、PM10、CO、NO2、SO2)的上升而增大。空气质量指数AQI为y,PM2.5的含量为x1,PM10的含量为x2,CO的含量为x3,NO2的含量为x4,SO2的含量为x5。利用matlab分别作出y对x1、x2、x3、x4、x5的散点图,如后图所示,所以假设y与x1、x2、x3、x4、x5的关系为线性关系。图2-1-SEQ图2-1-\*ARABIC1Y对x1的散点图图2-1-SEQ图2-1-\*ARABIC2Y对x1的散点图图2-1SEQ图2-1\*ARABIC1Y对x2的散点图Y对x2的散点图2.2符号假设r:残差向量rint:r的置信区间b:参数估计值bint:b的置信区间:复相关系数F:检验统计量P:F统计量对应的概率:剩余平方和State:回归模型的检验统计量β:回归系数向量β=(,,,,,)Y:空气质量指数向量X1:PM2.5的含量(直径小于)X2:PM10的含量(直径小于10um的可吸入颗粒)X3:CO的含量(CO为一氧化碳)X4:NO2的含量(NO2为二氧化氮)X5:SO2的含量(SO2为二氧化硫)ε:随机误差p:相关系数矩阵模型一的建立空气质量指数AQI为y与PM2.5的含量为x1,PM10的含量为x2,CO的含量为x3,NO2的含量为x4,SO2的含量为x5之间的多元线性回归模型为y=+x1+x2+x3+x4+x5+ε其中,,,,,是带估计的回归系数,ε是随机误差。计算3.1问题一的计算利用matlab命令:[b,bint,r,rint,s]=regress(y,X),rcoplot(r,rint)得到残差分析表图2-1-SEQ图2-1-\*ARABIC3再由残差置信区间得出异常数据第8、25、26、31、33、36、37、38、39、40、50、51、56、57、79、223、229、276组得到回归模型的系数(置信区间95%)表3-SEQ表3-\*ARABIC1回归系数回归系数估计值回归系数置信区间[11.993020.0938][-0.03950.2033][0.58780.7622][7.877120.0189][-0.3666-0.0951][-0.5515-0.1309]有表中数据可知的置信区间包含零点,所以这个系数的解释是不可靠的。再用matlab中的corrcoef命令直接得到相关系数矩阵又表中数据可知X1与X2关系显著,所以X1多余,应当去掉。去掉X1后再用上述方法得到残差分析表图2-1-SEQ图2-1-\*ARABIC4由残差置信区间得出异常数据第8、25、26、31、33、36、37、38、39、40、50、51、56、57、79、223、229、276,321组得到回归模型的系数(置信区间95%)表3-SEQ表3-\*ARABIC2回归系数回归系数估计值回归系数置信区间[11.257918.7631][0.66580.7756][9.833121.1111][-0.3672-0.0955][-0.5484-0.1276]数据真实性判定:表3-SEQ表3-\*ARABIC3组数AQI指数PM10CONO2SO2异常点(为0异常)301553149174321555114303475527541752106431571452296415208404156434753910461643462188256543160192401156544632872438562741633186107162614304668762942682098859931258223895060311302768918281230367895988318349910714163114010242683522013710377106572451105375628180416106771245425208108801473818501091381845656056109159213695