sklearn-SVC实现与类参数详解
作者:TiRan_Yang 发布时间:2023-09-04 18:10:43
sklearn-SVC实现与类参数
对应的API:http://scikit-learn.sourceforge.net/stable/modules/generated/sklearn.svm.SVC.html
它是基于libsvm实现的。随着样本数量的增加,拟合时间的复杂度要高于二次,这就使得当样板数量超过一万个时,很难扩展到数据集中。
在多类处理时,是按照1对1的方案进行处理的。
函数的的定义为:
def __init__ (self, C=1.0, kernel='rbf', degree=3, gamma='auto',coef0=0.0,
verbose=False, max_iter=-1, decision_function_shape='ovr', random_state=None):
参数的含义:
- C:float参数 默认值为1.0。错误项的惩罚系数。C越大,即对分错样本的惩罚程度越大,因此在训练样本中准确率越高,但是泛化能力降低,也就是对测试数据的分类准确率降低。相反,减小C的话,容许训练样本中有一些误分类错误样本,泛化能力强。对于训练样本带有噪声的情况,一般采用后者,把训练样本集中错误分类的样本作为噪声。
- kernel: str参数 默认为‘rbf‘,算法中采用的核函数类型,可选参数有:
linear:线性核函数
poly:多项式核函数
rbf:径像核函数/高斯核
sigmod:sigmod核函数
precomputed:核矩阵
- degree :int型参数 (default=3),这个参数只对多项式核函数(poly)有用,是指多项式核函数的阶数n,如果给的核函数参数是其他核函数,则会自动忽略该参数。
- gamma:float参数,默认为auto核函数系数,只对'rbf'、 ‘poly' 、 ‘sigmoid'有效。
如果gamma为auto,代表其值为样本特征数的倒数,即1/n_features。
- coef0:float参数 默认为0.0
核函数中的独立项,只有对‘poly'和‘sigmod'核函数有用,是指其中的参数c
- probability:bool参数 默认为False
是否启用概率估计。 这必须在调用fit()之前启用,并且会fit()方法速度变慢。
- shrinking:bool参数 默认为True
是否采用启发式收缩方式。
- tol: float参数 默认为1e^-3
svm停止训练的误差精度。
- cache_size:float参数 默认为200
指定训练所需要的内存,以MB为单位,默认为200MB。 - class_weight:字典类型或者‘balance'字符串。默认为None
给每个类别分别设置不同的惩罚参数C,则该类别的惩罚系数为class_weight[i]*C,如果没有给,则会给所有类别都给C=1,即前面参数指出的参数C。
如果给定参数‘balance',则使用y的值自动调整与输入数据中的类频率成反比的权重。
- verbose :bool参数 默认为False
是否启用详细输出。 此设置利用libsvm中的每个进程运行时设置,如果启用,可能无法在多线程上下文中正常工作。一般情况都设为False,不用管它。
- max_iter :int参数 默认为-1
最大迭代次数,如果为-1,表示不限制
- random_state:int型参数 默认为None
伪随机数发生器的种子,在混洗数据时用于概率估计。
SVC的方法
1、fit()方法:用于训练SVM,具体参数已经在定义SVC对象的时候给出了,这时候只需要给出数据集X和X对应的标签y即可。
2、predict()方法:基于以上的训练,对预测样本T进行类别预测,因此只需要接收一个测试集T,该函数返回一个数组表示个测试样本的类别。
3、predict_proba():返回每个输入类别的概率,这与predict方法不同,predict方法返回的输入样本属于那个类别,但没有概率。使用此方法时,需要在初始化时,将 probability参数设置为True。
例如:
import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm
# we create 40 separable points
np.random.seed(0)
X = np.r_[np.random.randn(20, 2) - [2, 2], np.random.randn(20, 2) + [2, 2]]
Y = [0] * 20 + [1] * 20
# fit the model
clf = svm.SVC(kernel='linear',probability=True)
clf.fit(X, Y)
print(clf.predict_proba([[-0.1,0.7],[0.3,0.5]]))
#result
#[[ 0.41844015 0.58155985]
#[ 0.34810738 0.65189262]]
如果初始化时不适用probability参数:
clf = svm.SVC(kernel='linear')
clf.fit(X, Y)
print(clf.predict([[-0.1,0.7],[0.3,0.5]]))
# get the separating hyperplane
w = clf.coef_[0]
#输出的结果为:[1,1]
属性有哪些:
svc.n_support_:各类各有多少个支持向量
svc.support_:各类的支持向量在训练样本中的索引
svc.support_vectors_:各类所有的支持向量
来源:https://blog.csdn.net/lovelyaiq/article/details/78611190


猜你喜欢
- 本文实例为大家分享了Python实现双人五子棋对局的具体代码,供大家参考,具体内容如下效果:自己需要两个棋子:服务器玩家全部代码:# 案列使
- 下面介绍下Python import与from import使用,具体内容如下所示:Python程序可以调用一组基本的函数(即内建函数),比
- 今天我们来学习用 Web 标准的方法来制作 Google 首页(中文)。Google 首页一直是用 table 布局的。我们把 Google
- 传染源: 野生动物,可能为中华菊头蝠病毒: 新型冠状病毒 2019-nCoV传播途径: 经呼吸道飞沫传播,亦可
- RSA加密是一种非对称加密,通常使用公钥加密,私钥解密,私钥签名,公钥验签。在公开密钥密码体制中,加密密钥(即公开密钥)PK是公开信息,而解
- 例如我们有如下结构的文件:pkg/ __init__.py libs/ some_lib.py __init__.py components
- clipboardData 对象提供了对于预定义的剪贴板格式的访问,以便在编辑操作中使用。成员表方法 描述 clearData 通过 dat
- python中的sys是提供了一系列有关python运行环境的变量和函数的模块,如sys.argv函数实现从程序外部向程序传递参数;sys.
- 本文实例讲述了Python实现将照片变成卡通图片的方法。分享给大家供大家参考,具体如下:之前的文章介绍了使用Photoshop将照片变成卡通
- 下表列出了所有Python语言支持的比较操作符。假设变量a持有10和变量b持有20,则: 例如:试试下面的例子就明白了所有的Pyt
- 1. 编码问题:遇到了几个字符串转换问题,总结如下:# str to bytes str.encode(s)# bytes to str b
- 云平台是个好东西,MySQL-mmm的典型配置是需要五台机器,一台作为mmm admin,两台master,两台slave。一下子找五台机器
- 为什么要 mock?后台接口还没完成,但前端要用到接口我想篡改后台接口的结果,测试一些分支逻辑起步本篇文章会使用到 swr、axios、vi
- LyScript 插件默认提供了一个get_disasm_code()方法可以直接获取到指定行数的反汇编代码,但如果需要自定义获取或者是需要
- jTopo 帮助说明网站http://www.jtopo.com/index.html使用例子:http://www.jtopo.com/d
- 1.event.srcElement //srcElement只能在IE下使用target是FireFox使用的,下面是兼容性写法 var
- 目录1.jupyter2.jupyter基础操作2.1windows更新pip库2.2jupyter安装2.3初次启动jupyter2.4设
- js中用import导入模块和用require导入模块的区别JavaScript中,模块是一种可重用的代码块,它将一些代码打包成一个单独的单
- PyQt5图片显示控件QPixmap介绍QPixmap类用于绘图设备的图像显示,它可以作为一个QPainterDevice对象,也可以加载到
- 算法流程:将图像转换为灰度图像利用Sobel滤波器求出 海森矩阵 (Hessian matrix) :将高斯滤波器分别作用于Ix&s