第二章 SAS软件介绍.ppt
上传人:sy****28 上传时间:2024-09-10 格式:PPT 页数:67 大小:1.7MB 金币:16 举报 版权申诉
预览加载中,请您耐心等待几秒...

第二章 SAS软件介绍.ppt

第二章SAS软件介绍.ppt

预览

免费试读已结束,剩余 57 页请下载文档后查看

16 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

朱连华Tel:13675122648南京信息工程大学数理学院统计系E-mail:ahualian@126.com第二章SAS软件介绍一、SAS系统概述在英美等国,能熟练使用SAS进行统计分析是许多公司和科研机构选材的条件之一。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,并在96~97年度被评选为建立数据库的首选产品。堪称统计软件界的巨无霸。在此仅举一例如下:在以苛刻严格著称于世的美国FDA新药审批程序中,新药试验结果的统计分析规定只能用SAS进行,其他软件的计算结果一律无效!哪怕只是简单的均数和标准差也不行!由此可见SAS的权威地位。SAS系统是集数据分析、生成报表于一体的一种集成软件系统。它由基本部分和外加模块组成:基本部分:BASESAS部分;统计分析计算部分:SAS/STAT;绘图部分:SAS/GRAPH;矩阵运算部分:SAS/IML;运筹学和线性规划:SAS/OR;经济预测和时间序列分析:SAS/ETS;质量控制模块:SAS/QC快速数据处理的交互式菜单系统模块:SAS/FSP交互式全屏幕软件应用系统模块:SAS/AF二、初识SAS启动SASSAS有三个最重要的子窗口:程序窗口(PROGRAMEDITOR)、运行记录窗口(LOG)、输出窗口(OUTPUT)。简单运行样例假设我们有一个班学生的数学成绩和语文成绩,数学满分为100,语文满分为120,希望计算学生的平均分数(按百分制)并按此排名,可以在程序窗口输入此程序:title'0901班学生成绩排名';libnamea‘d:\’;/*环境设置语句*/dataa.c0901;inputname$1-10sex$mathchinese;avg=math*0.5+chinese/120*100*0.5;cards;李明男9298张红艺女89106王思明男8690张聪男98109刘颍女80110;run;procprint;run;procsortdata=a.c0901;bydescendingavg;/*按平均成绩降序排序*/run;procprint;run;实际上,上述程序是文本,完全可以在任何文本编辑工具中输入,比如Windows中的记事本,甚至Word也可用来输入这样包含中文的程序。输入后使用复制复制、粘贴命令将输入的程序粘贴到SAS系统程序窗口。(即在记事本中复制输入的程序,然后在SAS系统程序窗口中使用粘贴命令,把程序复制到SAS中)。要运行此程序,只要用鼠标单击工具栏的提交(Submit)图标,或用Run菜单下的Submit命令,或者直接按下F8键,就可运行程序。如果选中某一段程序,然后进行调用,则系统只执行被选中的部分。运行后,输出窗口出现如下结果:0901班学生成绩排名Obsnamesexmathchineseavg1李明男929886.83332张红艺女8910688.66673王思明男869080.50004张聪男9810994.41675刘颍女8011085.8333运行记录窗口则记录每段程序的运行情况、所用时间、生成数据保存情况。如果有错误还会用红色指示错误。三、SAS程序的使用常识SAS程序的程序注释有以下两种格式:增强程序可读性注释语句:以星号“*”开始,可占多行,以分号“;”结束。~/*该段有待核实*/注释段落:用“/*”和“*/”包括起来的任何字符,可占多行。SAS程序的程序组成SAS程序可以非常复杂,但其基本结构一般由数个完成单个动作的环境设置语句和程序步构成。而程序步分为两种,一种叫数据步(datastep),一种叫过程步(procstep),分别以DATA语句和PROC语句开始。数据步和过程步由若干个语句组成,一般以RUN语句结束。NAME数据集的每一行叫做一个观测(Observation),每列叫做一个变量(Variable)。在数据库术语中一个观测称作一个记录,一个变量称作一个域。SAS数据集等价于关系数据库系统中的一个表,实际上一个SAS数据集有时也称作一个表。从上面看出,数据集要有名字,变量要有名字,所以SAS中对名字(数据集名、变量名、数据库名,等等)有约定:SAS名字由英文字母、数字、下划线组成,第一个字符必须是字母或下划线,名字最多用8个字符,大写字母和小写字母不区分。比如,name,abc,aBC,x1,year12,_NULL_等是合法的名字,且abc和aBC是同一个名字,而class-1(不能有减号)、abit(不能有空格)、serial#(不能有特殊字符)、Documents(超长)等不是合法的名字。逻辑库SAS系统将所使用的文件以库的形式组织起来,而数据集则存放在一个库中,这个库就称