监督分类的方法
监督分类的方法
监督分类是一种数据分析技术,是一种机器学习算法,它很大程度上是在两类或者多类数据之间划分线性分类模型。它是将已经标记的训练数据集映射成一个函数,从而预测没有标记的数据集属于哪一类。
监督分类通常有四种方法:
正则化半监督方法 一、K最近邻(K-Nearest Neighbors)法
K最近邻(KNN)法是最常用的监督分类法之一。它是一种基于实例的方法,其假设一个新实例的类别可以由它最近的训练实例的类别来决定(即K个最相似的实例),而不是统计分布。KNN是一种基于投票的方法,即多数表决算法。KNN的工作机制如下:对于一个未知类别的实例,依次取它距离最近的K个已知类别的实例,确定它的类别。
二、朴素贝叶斯(Naive Bayes)
朴素贝叶斯(NB)是一种统计学方法,它假设每个特征属性之间相互独立,这个假设被称为贝叶斯假设或者朴素假设。它被广泛地用于文档分类,数据挖掘,垃圾邮件过滤,和其他数据相关的应用场景中。
三、决策树(Decision Tree)
决策树是一种监督学习的方法,它利用一系列问题来决定某一特定的类别分类的结果。使用决策树可以将未确定的分类结果拆分成各个层次的问题,每个问题都可以用有限数量的语句来表示,称为决策节点,从而对分类结果进行准确的判断,并且决策树可以根据每个决策节点建立模型,将训练数据集映射成决策树模型,从而得出预测结果。
四、支持向量机(Support Vector Machine)
支持向量机(SVM)是一种监督式学习的技术,它可以用来在样本空间中建立一个最佳的超平面,从而将类别完全分开。它有两个基本概念:核函数和决策函数,其工作原理是:它从原始数据中提取出最佳分类的超平面,再根据支持向量的距离来判断类别,从而使得分类效果尽可能获得最高的精度。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论