利用全连接神经网络实现手写数字识别-使用Python语言,Keras框架--688IT编程网

利⽤全连接神经⽹络实现⼿写数字识别-使⽤Python语⾔，Keras框架

1.问题描述?

本⽂要解决的问题是⼿写数字识别。使⽤的数据集为：。

我们需要让计算机识别图⽚中的⼿写数字是多少。

这个问题对于我们⼈类来说⾮常简单，⼀眼就看出来图⽚中的数字是⼏了。但是对于机器来说却很难，因为机器从⼀张图⽚中看到的是⼀堆没啥意义的数字。

2.解决思路?

那如何让计算机认出图⽚中的数字是⼏呢？

在计算机中，图⽚是由多个像素组成的。如果图⽚是灰度图则每个像素由8位⼆进制组成。

如果图⽚是彩⾊图⽚，则每个像素由三个8位⼆进制表⽰(分别表⽰红、绿、蓝三种颜⾊的值)。

虽然单个像素不能表达任何信息，但是把多个像素连在⼀起，不同数字的图⽚就有不同的特征了。⽐如，下⾯这张图⽚。

乍⼀看，我们可能看不出来图⽚表⽰什么。但是如果我们把不是0的部分都加上阴影，数字越⼤阴影越深。

你就能看出来上⾯的图⽚代表数字4了。

计算机可以采⽤同样的原理。⼀个像素代表不了什么，但是多个像素组合起来，就能表⽰出不同数字的特征了。依据这些特征，就可以识别出图⽚中代表的数字了。

3.模型架构?

本⽂将采全连接⽹络来实现⼿写数字的识别。整个⽹络包含两个、两个和⼀个输出层。

因为输出的结果为0-9数字中的⼀个，⼀共包含10类。因此使⽤输出图⽚对于每种类别的概率。

4.⼯具包说明?

import keras

validation框架from keras.datasets import mnist

dels import Sequential

from keras.layers import Dense, Dropout

from keras.optimizers import RMSprop

1). ⾸先导⼊keras核⼼类库

2). 接着导⼊keras⾃带的数据⼯具类mnist，该类会从下载mnist数据集()。

3). 然后导⼊线性模型构造器(也叫贯穿模型Sequential,⽤来构造简单的流⽔线式机器学习模型)

4). 之后导⼊全连接层Dense和Dropout层Dropout

5). 最后导⼊模型优化器RMSprop，Keras会通过优化器来更新参数，优化模型。

5.定义全局变量?

batch_size = 128

num_classes = 10

epochs = 20

1). 设置每批处理的样本数量，本例中每批随机抽泣128个样本进⾏处理

2). 设置总分类数，本例会将图⽚分为0-9，共10个类别

3). 设置训练轮数，本例总总共训练20轮，即所有样本都会被重复训练20次

6.加载数据?

(x_train, y_train), (x_test, y_test) = mnist.load_data()

1). 通过keras⾃带的mnist⼯具包加载数据

2). 加载出的数据分成两部分，训练数据集(60000张图⽚)和测试数据集(10000张图⽚)

3). 每个数据集中⼜包含样本特征和样本标签两个部分

4). 样本特征为图⽚的像素数据，每张图⽚有28*28共784个像素组成

5). 样本标签为图⽚上对应的真实数字

keras会总动从amazonaws下载数据集，如果下载失败请参考

7.设置数据形状?

x_train = shape(60000, 784)

x_test = shape(10000, 784)

1). 将训练样本集的特征数据，变成60000⾏784列(28*28)

2). 将测试样本集的特征数据，变成10000⾏784列

3). 转化后，样本集中的每⼀⾏都代表⼀个样本，每个样本有784个特征(784个像素)

如果是⼿⼯下载的数据集，数据集本⾝已经做过形状处理了，⽆需本步操作

8.设置数据类型?

x_train = x_train.astype('float32')

x_test = x_test.astype('float32')

将特征数据强制转化成float32类型，⽅便tensorflow等框架的处理

如果是⼿⼯下载的数据集，数据类型已经转化过了，⽆需本步操作

9.数据归⼀化?

x_train /= 255

x_test /= 255

1). 因为每个像素都是⽤8位⼆进制表⽰的，因此最⼤值为255

2). 特征数据除以255后，其值缩⼩到0-1范围内了，此操作称作

3). 数据归⼀化后，可以加速模型收敛，提升训练速度

如果是⼿⼯下载的数据集，数据已经归⼀化了，⽆需本步操作

10.将标签转化成one-hot形式?

y_train = _categorical(y_train, num_classes)

y_test = _categorical(y_test, num_classes)

1). ⽬前样本标签为1、2、3……等⾃然数

2). SoftMax分类输出的结果为各个类别的概率，⽽不是1、2、3……等⾃然数

3). 因此需要将样本标签转化成向量，样本标签对应的元素为1，其他元素为0。

转化后，训练样本集的标签数据将包含60000⾏10列，每⾏为1个样本标签，样本标签为⼀个向量，向量中值为1的元素索引就是图⽚对应的数字。

11.构建模型?

model = Sequential()

model.add(Dense(512, activation='relu', input_shape=(784,)))

model.add(Dropout(0.2))

model.add(Dense(512, activation='relu'))

model.add(Dropout(0.2))

model.add(Dense(num_classes, activation='softmax'))

1). ⾸先通过线性模型构造器，创建⼀个模型model

2). 接着向模型中添加⼀个全连接层Dense，该层包含512个神经元、激活函数为relu，输⼊样本的形状为(784,)

3). 然后向模型中添加⼀个Dropout层，该层会随机丢弃20%神经元(随机将20%神经元的输出强制清零)

4). 然后再向模型中添加⼀个全连接层Dense，该层包含512个神经元、激活函数为relu

5). 之后再向模型中添加⼀个Dropout层，该层会随机丢弃20%神经元(随机将20%神经元的输出强制清零)

6). 最后向模型中添加⼀个全连接层⽤作输出，该层神经元的数量与分类数量⼀致，使⽤的激活函数为SoftMax，来输出样本属于各个类别的概率。

12.输出模型结构?

model.summary()

688IT编程网

利用全连接神经网络实现手写数字识别-使用Python语言,Keras框架

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

利用全连接神经网络实现手写数字识别-使用Python语言,Keras框架

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式