如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
R1310Y40/2WangYongGraduateUniversityofChineseAcademyofSciences2009.10.31wangyong@gucas.ac.cnhttp://liama.ia.ac.cn/wiki/user:wangyong:home数据挖掘工具与自由软件数据挖掘软件介绍数据挖掘软件介绍自由软件介绍自由软件介绍ScilabScilab软件介绍软件介绍SVMSVM软件介绍软件介绍WekaWeka软件介绍软件介绍数据挖掘工具与自由软件RobertGrossman的观点数据挖掘软件的发展NationalCenterforDataMiningUniversityofIllinoisatChicago年代特征数据挖掘算法集成分布计算模型数据模型数据挖掘作为支持一个或第一代独立的系统单个机器向量数据一个独立的应用者多个算法多个算法:能有些系统支持和数据库以及数据管理系统,包同质/局部区域第二代够挖掘一次不能对象、文本、和数据仓库集成括数据库和数据仓库的计算机群集放进内存的数据连续的媒体数据和预言模数据管理和intranet/extr支持半结构化第三代多个算法型系统集成预言模型系统anet网络计算数据和web数据和移动数据/各数据管理、预言移动和各普遍存在第四代多个算法种计算数据联合模型、移动系统种计算设备的计算模型数据挖掘工具与自由软件数据挖掘工具与自由软件数据挖掘工具与自由软件数据挖掘工具与自由软件数据挖掘工具与自由软件数据统计分析软件“三剑客”SPSSSASSTATA由美国斯坦福大学最早由北卡罗来纳由美国计算机资源的三位研究生于20大学的两位生物统中心于1985年研制世纪60年代末研制计学研究生编制,。由于STATA在分,同时成立了SPSS并于1976年成立了析时是将数据全部公司。1984年首先SAS软件研究所。读入内存,在计算推出了世界上第一SAS系统被誉为国全部完成后才和磁个统计分析软件微际上的标准软件系盘交换数据,因此机版本SPSS/PC+。统。计算速度极快。数据挖掘工具与自由软件SPSS一般用法:容易使用,故最为初学者所接受。它有一个可以点击的交互界面,能够使用下拉菜单来选择所需要执行的命令,也有一个通过拷贝和粘贴的方法来学习其“句法”语言,但是这些句法通常非常复杂,不是很直观。数据管理:有一个类似Excel的界面友好的数据编辑器,可以用来输入和定义数据(缺失值,数值标签等等)。但它并不是功能很强的数据管理工具,主要用于对一个文件进行操作,难以胜任同时处理多个文件。统计分析:能够进行大多数统计分析(回归分析,logistic回归,生存分析,方差分析,因子分析,多变量分析)。它的优势在于方差分析(SPSS能完成多种特殊效应的检验)和多变量分析(多元方差分析,因子分析,判别分析等)。绘图功能:SPSS绘图的交互界面非常简单,一旦你绘出图形,你可以根据需要通过点击来修改。总结:SPSS致力于简便易行(其口号是“真正统计,确实简单”),并且取得了成功。但是处理前沿的统计过程是其弱项。数据挖掘工具与自由软件SAS一般用法:功能强大而且可以编程,很受高级用户的欢迎。也正是基于此,它是最难掌握的软件之一。使用时,需要编写程序来处理、分析数据。数据管理:可以在SAS数据集中使用SQL查询,可以同时处理多个数据文件,以及硬盘空间所允许的最大数量的记录条数。统计分析:能进行大多数统计分析(回归分析,logistic回归,生存分析,方差分析,因子分析,多变量分析)。尽管支持调查数据的分析,但与STATA比较仍然是相当有限的。绘图功能:在所有的统计软件中,SAS有最强大的绘图工具,由SAS/Graph模块提供。然而,SAS/Graph模块的学习也是非常专业而复杂,图形的制作主要使用程序语言。SAS8虽然可以通过点击鼠标来交互式的绘图,但不象SPSS那样简单。总结:SAS适合高级用户使用。它的学习过程是艰苦的,最初的阶段会使人灰心丧气。然而它还是以强大的数据管理和同时处理大批数据文件的功能,得到高级用户的青睐。数据挖掘工具与自由软件STATA一般用法:以其简单易懂和功能强大受到初学者和高级用户的普遍欢迎。使用时可以每次只输入一个命令(适合初学者),也可以通过一个STATA程序一次输入多个命令(适合高级用户)。这样的话,即使发生错误,也较容易找出并加以修改。数据管理:主要用于每次对一个数据文件进行操作,难以同时处理多个文件。统计分析:也能够进行大多数统计分析。在调查数据分析领