kmeans鸢尾花分类python代码_python机器学习基础教程-鸢尾花分类--688IT编程网

kmeans鸢尾花分类python代码_python机器学习基础教程-鸢如何搭建个人博客网站

即墨webservice培训尾花分类

⼀: 环境准备:

1.导⼊的库:

importnumpy as npimportmatplotlib.pyplot as pltimportpandas as pdimport mglearn

2.导⼊数据集

from sklearn.datasets importload_iris

iris_dataset= load_iris()

⼆. 划分训练数据和测试数据

1. train_test_split: 将数据集打乱并进⾏拆分

del_selection importtrain_test_split

X_train, X_test, y_train, y_test=train_test_split(php是啥格式

iris_dataset['data'], iris_dataset['target'], random_state=0)

其中,random_state=0，表⽰每次调⽤train_test_split返回的输出都是不变的，即随机数⽣成器的种⼦是相同的.

⽣成的

2.scatter_matrix: 使⽤pandas绘制散点图矩阵(即取出两⾏,⼀⾏的元素作为横坐标,⼀⾏的元素作为纵坐标)

iris_dataframe = pd.DataFrame(X_train, columns=iris_dataset.feature_names) #columns设置索引

grr = pd.plotting.scatter_matrix(iris_dataframe, c=y_train, figsize=(15,15),

marker='o', hist_kwds={'bins':20}, s=60, alpha=.8, 3)

参数解释: frame：数据的dataframe，本例为4*150的矩阵; c是颜⾊，本例中按照y_train的不同来分配不同的颜⾊; figsize设置图⽚的尺⼨; marker是散点的形状,'o'是圆形,'*'是星形 ; hist_kwds是直⽅图的相关参数,{'bins':20}是⽣成包含20个长条的直⽅图;

s是⼤图的尺⼨ ; alpha是图的透明度; cmap是colourmap，就是颜⾊板

三 k近邻算法

1.原理: 将新数据点放到训练集中，出训练集中与新数据点直线距离最近的若⼲个点，然后出这若⼲个点属于哪个类别的点最多，就将训练集视为哪个类别.

2.使⽤⽅法

表达视图的作用>js生成连续的四位数连续的2.1.scikit-learn中所有的机器学习模型都在各⾃的类中实现，这些类被称为Estimator类。k近邻分类算法是在neighbors模块的KNeighborsClassifier类中实现。

ighbors import KNeighborsClassifier

2.2.使⽤k近邻⾸先需要将KNeighborsClassifier实例化成⼀个对象.

knn = KNeighborsClassifier(n_neighbors=1)

knn对象可以⽤训练数据重新训练，也可以对新数据点进⾏预测，也可以从训练数据中提取信息.

2.3 基于训练集构建模型

调⽤knn对象的fit⽅法，输⼊参数X_train和y_train

In: knn.fit(X_train,y_train)

python基础代码实例Out: KNeighborsClassifier(algorithm='auto', leaf_size=30, metric='minkowski',

metric_params=None, n_jobs=None, n_neighbors=1, p=2,

weights='uniform')

2.4 做出预测

2.4.1 构建numpy数组(scikit-learn输⼊的数据必须是⼆维数组)

X_new = np.array([[5,2.9,1,0.2]])print(X_new.shape)

2.4.2 调⽤predict函数

prediction =knn.predict(X_new)print(prediction)print(iris_dataset['target_names'][prediction]) 2.5 评估模型

y_pred =knn.predict(X_test)print(y_pred)an(y_pred == y_test))

print(knn.score(X_test,y_test))

---摘录⾃python机器学习基础教程

688IT编程网

kmeans鸢尾花分类python代码_python机器学习基础教程-鸢尾花分类

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

kmeans鸢尾花分类python代码_python机器学习基础教程-鸢尾花分类

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式