组件名称

  线性支持向量机 [版本号:1] [更新时间:2018-05-08]

简介

  支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折中,以求获得最好的推广能力 。 在机器学习中,支持向量机(SVM,还支持矢量网络)是与相关的学习算法有关的监督学习模型,可以分析数据,识别模式,用于分类和回归分析。给定一组训练样本,每个标记为属于两类,一个SVM训练算法建立了一个模型,分配新的实例为一类或其他类,使其成为非概率二元线性分类。一个SVM模型的例子,如在空间中的点,映射,使得所述不同的类别的例子是由一个明显的差距是尽可能宽划分的表示。新的实施例则映射到相同的空间中,并预测基于它们落在所述间隙侧上属于一个类别。广义上的支持向量机分为线性可分,线性,非线性支持向量机。按照其算法功能可分为分类与回归功能的支持向量机。平台上的支持向量机算法目前支持线性分类功能。 给定训练集,T=(x1,y1),(x2,y2)....(xn,yn){(x_{1},y_{1}),(x_{2},y_{2})....(x_{n},y_{n})}xiϵX=Rnx_{i}\epsilon X=R^{n}, yiϵy_{i}\epsilon (-1,1) 则分类函数为f(x)=sgn(g(x))=W^{T}x+b,问题转化为 {WTx+b<=1,yi=1 WTx+b>=1,yi=1\left\{\begin{matrix} W^{T}x+b<=-1,y_{i}=-1\ W^{T}x+b>=-1,y_{i}=1\end{matrix}\right. 寻找最优的划分转化为如下的二次规划问题: min 1/2w\left \| w \right \| s.t. yi(wTx+b)>=1,xϵy_{i}(w^{T}*x+b)>=1,x\epsilon X 利用Lagrange乘子法得到最优解,引入Lagrange乘子: L(w,b,α)=1/2w+i=1n(1yi(wxi+b))αiL(w,b,\alpha )=1/2\left \| w \right \|+\sum _{i=1}^{n}(1-y_{i}(w*x_{i}+b))*\alpha _{i} w=i=1nαiyixiw=\sum _{i=1}^{n}\alpha _{i}y_{i}x_{i} i=1nαiyi\sum _{i=1}^{n}\alpha _{i}y_{i}=0 可得分类函数f(x)=sgn(i=1nαiyi(xix)+b)f(x)=sgn(\sum _{i=1}^{n}\alpha _{i}y_{i}(x_{i}x)+b)

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
正则化项系数 平衡loss和正则化项的大小以使得模型的训练误差和泛化能力达到最优,可选 0 必填
是否设置截距项 True 必填
最小收敛误差 1e-06 必填
最大迭代次数 100 必填

字段配置

字段名称 字段说明 字段默认值 是否必配
特征列 输入模型的样本特征列 必选 支持Double/Int类型字段 必填
标签列 输入模型的样本类别标签列 必选 支持Double/Int类型字段 必填

输出节点的字段配置说明

  运行后不生成新字段。后续节点可以直接选择字段。

results matching ""

    No results matching ""