LIBSVM使用方法.doc
上传人:sy****28 上传时间:2024-09-13 格式:DOC 页数:3 大小:23KB 金币:14 举报 版权申诉
预览加载中,请您耐心等待几秒...

LIBSVM使用方法.doc

LIBSVM使用方法.doc

预览

在线预览结束,喜欢就下载吧,查找使用更方便

14 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

LIBSVM1LIBSVM简介LIBSVM是台湾大学林智仁(LinChih-Jen)副教授等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包,他不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进、修改以及在其它操作系统上应用;该软件还有一个特点,就是对SVM所涉及的参数调节相对比较少,提供了很多的默认参数,利用这些默认参数就可以解决很多问题;并且提供了交互检验(Cross-SVM回归等问题,包括基于一对一算法的多类模式识别问题。SVM用于模式识别或回归时,SVM方法及其参数、核函数及其参数的选择,目前国际上还没有形成一个统一的模式,也就是说最优SVM算法参数选择还只能是凭借经验、实验对比、大范围的搜寻或者利用软件包提供的交互检验功能进行寻优。ν-SVM回归和ε-SVM分类、νValidation)的功能。该软件包可以在http://www.csie.ntu.edu.tw/~cjlin/免费获得。该软件可以解决C-SVM分类、-SVM回归等问题,包括基于一对一算法的多类模式识别问题。SVM用于模式识别或回归时,SVM方法及其参数、核函数及其参数的选择,目前国际上还没有形成一个统一的模式,也就是说最优SVM算法参数选择还只能是凭借经验、实验对比、大范围的搜寻或者利用软件包提供的交互检验功能进行寻优。2LIBSVM使用方法LibSVM是以源代码和可执行文件两种方式给出的。如果是Windows系列操作系统,可以直接使用软件包提供的程序,也可以进行修改编译;如果是Unix类系统,必须自己编译,软件包中提供了编译格式文件,我们在SGI工作站(操作系统IRIX6.5)上,使用免费编译器GNUC++3.3编译通过。2.1LIBSVM使用的一般步骤:1)2)3)4)5)6)按照LIBSVM软件包所要求的格式准备数据集;对数据进行简单的缩放操作;考虑选用RBF核函数;采用交叉验证选择最佳参数C与g;采用最佳参数C与g对整个训练集进行训练获取支持向量机模型;利用获取的模型进行测试与预测。2.2LIBSVM使用的数据格式该软件使用的训练数据和检验数据文件格式如下:<label><index1>:<value1><index2>:<value2>...其中<label>是训练数据集的目标值,对于分类,它是标识某类的整数(支持多个类);对于回归,是任意实数。<index>是以1开始的整数,可以是不连续的;<value>为实数,也就是我们常说的自变量。检验数据文件中的label只用于计算准确度或误差,如果它是未知的,只需用一个数填写这一栏,也可以空着不填。在程序包中,还包括有一个训练数据实例:heart_scale,方便参考数据文件格式以及练习使用软件。可以编写小程序,将自己常用的数据格式转换成这种格式。2.3Svmtrain和Svmpredict的用法Svmtrain(训练建模)的用法:svmtrain[options]training_set_file[model_file]Options:可用的选项即表示的涵义如下-ssvm类型:SVM设置类型(默认0)0--C-SVC1--v-SVC2–一类SVM3--e-SVR4--v-SVR-t核函数类型:核函数设置类型(默认2)0–线性:u'v1–多项式:(r*u'v+coef0)^degree2–RBF函数:exp(-r|u-v|^2)3–sigmoid:tanh(r*u'v+coef0)-ddegree:核函数中的degree设置(默认3)-gr(gama):核函数中的?函数设置(默认1/k)-rcoef0:核函数中的coef0设置(默认0)-ccost:设置C-SVC,?-SVR和?-SVR的参数(默认1)-nnu:设置?-SVC,一类SVM和?-SVR的参数(默认0.5)-pe:设置?-SVR中损失函数?的值(默认0.1)-mcachesize:设置cache内存大小,以MB为单位(默认40)-eε:设置允许的终止判据(默认0.001)-hshrinking:是否使用启发式,0或1(默认1)-wiweight:设置第几类的参数C为weight?C(C-SVC中的C)(默认1)-vn:n-fold交互检验模式其中-g选项中的k是指输入数据中的属性数。option-v随机地将数据剖分为n部分并计算交互检验准确度和均方根误差。以上这些参数设置可以按照SVM的类型和核函数所支持的参数进行任意组合,如果设置的参数在函数或SVM类型中没有也不会产生影响,程序不会接受该参数;如果应有的参数设置不正确,参数将采用默认值。tr