python概念与术语_一些基本概念--688IT编程网

python概念与术语_⼀些基本概念

⼀些基本概念

在开始学习Keras之前，我们希望传递⼀些关于Keras，关于深度学习的基本概念和技术，我们建议新⼿在使⽤Keras之前浏览⼀下本页⾯提到的内容，这将减少你学习中的困惑

符号计算

Keras的底层库使⽤Theano或TensorFlow，这两个库也称为Keras的后端。⽆论是Theano还是TensorFlow，都是⼀个“符号式”的库。

因此，这也使得Keras的编程与传统的Python代码有所差别。笼统的说，符号主义的计算⾸先定义各种变量，然后建⽴⼀个“计算图”，计算图规定了各个变量之间的计算关系。建⽴好的计算图需要编译以确定其内部细节，然⽽，此时的计算图还是⼀个“空壳⼦”，⾥⾯没有任何实际的数据，只有当你把需要运算的输⼊放进去后，才能在整个模型中形成数据流，从⽽形成输出值。

就像⽤管道搭建供⽔系统，当你在拼⽔管的时候，⾥⾯是没有⽔的。只有所有的管⼦都接完了，才能送⽔。

Keras的模型搭建形式就是这种⽅法，在你搭建Keras模型完毕后，你的模型就是⼀个空壳⼦，只有实际⽣成可调⽤的函数后

(K.function)，输⼊数据，才会形成真正的数据流。

使⽤计算图的语⾔，如Theano，以难以调试⽽闻名，当Keras的Debug进⼊Theano这个层次时，往往也令⼈头痛。没有经验的开发者很难直观的感受到计算图到底在⼲些什么。尽管很让⼈头痛，但⼤多数的深度学习框架使⽤的都是符号计算这⼀套⽅法，因为符号计算能够提供关键的计算优化、⾃动求导等功能。

我们建议你在使⽤前稍微了解⼀下Theano或TensorFlow，Bing/Google⼀下即可。

张量

张量，或tensor，是本⽂档会经常出现的⼀个词汇，在此稍作解释。

使⽤这个词汇的⽬的是为了表述统⼀，张量可以看作是向量、矩阵的⾃然推⼴，我们⽤张量来表⽰⼴泛的数据类型。

规模最⼩的张量是0阶张量，即标量，也就是⼀个数。

当我们把⼀些数有序的排列起来，就形成了1阶张量，也就是⼀个向量

如果我们继续把⼀组向量有序的排列起来，就形成了2阶张量，也就是⼀个矩阵

把矩阵摞起来，就是3阶张量，我们可以称为⼀个⽴⽅体，具有3个颜⾊通道的彩⾊图⽚就是⼀个这样的⽴⽅体

把⽴⽅体摞起来，好吧这次我们真的没有给它起别名了，就叫4阶张量了，不要去试图想像4阶张量是什么样⼦，它就是个数学上的概念。

张量的阶数有时候也称为维度，或者轴，轴这个词翻译⾃英⽂axis。譬如⼀个矩阵[[1,2],[3,4]]，是⼀个2阶张量，有两个维度或轴，沿着第0个轴(为了与python的计数⽅式⼀致，本⽂档维度和轴从0算起)你看到的是[1,2]，[3,4]两个向量，沿着第1个轴你看到的是[1,3]，[2,4]两个向量。

要理解“沿着某个轴”是什么意思，不妨试着运⾏⼀下下⾯的代码：

import numpy as np

a = np.array([[1,2],[3,4]])

sum0 = np.sum(a, axis=0)

sum1 = np.sum(a, axis=1)

print sum0

python新手代码及作用print sum1

关于张量，⽬前知道这么多就⾜够了。事实上我也就知道这么多

data_format

这是⼀个⽆可奈何的问题，在如何表⽰⼀组彩⾊图⽚的问题上，Theano和TensorFlow发⽣了分歧，'th'模式，也即Theano模式会把100张RGB三通道的16×32(⾼为16宽为32)彩⾊图表⽰为下⾯这种形式(100,3,16,32)，Caffe采取的也是这种⽅式。第0个维度是样本维，代表样本的数⽬，第1个维度是通道维，代表颜⾊通道数。后⾯两个就是⾼和宽了。这种theano风格的数据组织⽅法，称

为“channels_first”，即通道维靠前。

⽽TensorFlow，的表达形式是(100,16,32,3)，即把通道维放在了最后，这种数据组织⽅式称为“channels_last”。

Keras默认的数据组织形式在~/.keras/keras.json中规定，可查看该⽂件的image_data_format⼀项查看，也可在代码中通过

K.image_data_format()函数返回，请在⽹络的训练和测试中保持维度顺序⼀致。

唉，真是蛋疼，你们商量好不⾏吗？

函数式模型

函数式模型算是本⽂档⽐较原创的词汇了，所以这⾥要说⼀下

在Keras 0.x中，模型其实有两种，⼀种叫Sequential，称为序贯模型，也就是单输⼊单输出，⼀条路通到底，层与层之间只有相邻关系，跨层连接统统没有。这种模型编译速度快，操作上也⽐较简单。第⼆种模型称为Graph，即图模型，这个模型⽀持多输⼊多输出，层与层之间想怎么连怎么连，但是编译速度慢。可以看到，Sequential其实是Graph的⼀个特殊情况。

在Keras1和Keras2中，图模型被移除，⽽增加了了“functional model API”，这个东西，更加强调了Sequential是特殊情况这⼀点。⼀般的模型就称为Model，然后如果你要⽤简单的Sequential，OK，那还有⼀个快捷⽅式Sequential。

由于functional model API在使⽤时利⽤的是“函数式编程”的风格，我们这⾥将其译为函数式模型。总⽽⾔之，只要这个东西接收⼀个或⼀些张量作为输⼊，然后输出的也是⼀个或⼀些张量，那不管它是什么⿁，统统都称作“模型”。

batch

这个概念与Keras⽆关，⽼实讲不应该出现在这⾥的，但是因为它频繁出现，⽽且不了解这个技术的话看函数说明会很头痛，这⾥还是简单说⼀下。

深度学习的优化算法，说⽩了就是梯度下降。每次的参数更新有两种⽅式。

第⼀种，遍历全部数据集算⼀次损失函数，然后算函数对各个参数的梯度，更新梯度。这种⽅法每更新⼀次参数都要把数据集⾥的所有样本都看⼀遍，计算量开销⼤，计算速度慢，不⽀持在线学习，这称为Batch gradient descent，批梯度下降。

另⼀种，每看⼀个数据就算⼀下损失函数，然后求梯度更新参数，这个称为随机梯度下降，stochastic gradient descent。这个⽅法速度⽐较快，但是收敛性能不太好，可能在最优点附近晃来晃去，hit不到最优点。两次参数的更新也有可能互相抵消掉，造成⽬标函数震荡的⽐较剧烈。

为了克服两种⽅法的缺点，现在⼀般采⽤的是⼀种折中⼿段，mini-batch gradient decent，⼩批的梯

度下降，这种⽅法把数据分为若⼲个批，按批来更新参数，这样，⼀个批中的⼀组数据共同决定了本次梯度的⽅向，下降起来就不容易跑偏，减少了随机性。另⼀⽅⾯因为批的样本数与整个数据集相⽐⼩了很多，计算量也不是很⼤。

基本上现在的梯度下降都是基于mini-batch的，所以Keras的模块中经常会出现batch_size，就是指这个。

顺便说⼀句，Keras中⽤的优化器SGD是stochastic gradient descent的缩写，但不代表是⼀个样本就更新⼀回，还是基于mini-batch 的。

epochs

真的不是很想解释这个词，但是新⼿问的还挺多的……

简单说，epochs指的就是训练过程中数据将被“轮”多少次，就这样。

对新⼿友好的⼩说明

虽然这不是我们应该做的⼯作，但为了体现本教程对新⼿的友好，我们在这⾥简单列⼀下使⽤keras需要的先⾏知识。稍有经验的研究者或开发者请忽略本节，对于新⼿，我们建议在开始之前，确保你了

解下⾯提到的术语的基本概念。如果你确实对某项内容不了解，请⾸先查阅相关资料，以免在未来使⽤中带来困惑。

关于Python

显然你应对Python有⼀定的熟悉，包括其基本语法，数据类型，语⾔特点等，如果你还不能使⽤Python进⾏程序设计，或不能避免Python中常见的⼀些⼩陷阱，或许你应该先去个教程补充⼀下。这⾥推⼀个快速学习Python的教程廖雪峰的Python教程

你应该有⾯向对象的概念，知道类、对象、封装、多态、继承、作⽤域等术语的含义。

你应该对Python的科学计算包和深度学习包有⼀定了解，这些包包含但不限于numpy, scipy, scikit-learn,

特别地，你需要了解什么是⽣成器函数(generator)，以及如何编写⽣成器函数。什么是匿名函数(lambda)

关于深度学习

由于Keras是为深度学习设计的⼯具，我们这⾥只列举深度学习中的⼀些基本概念。请确保你对下⾯的概念有⼀定理解。

有监督学习，⽆监督学习，分类，聚类，回归

神经元模型，多层感知器，BP算法

⽬标函数(损失函数)，激活函数，梯度下降法

全连接⽹络、卷积神经⽹络、递归神经⽹络

训练集，测试集，交叉验证，⽋拟合，过拟合

数据规范化

其他我还没想到的东西……想到再补充

其他

其他需要注意的概念，我们将使⽤[Tips]标注出来，如果该概念反复出现⼜⽐较重要，我们会写到这⾥。就酱，玩的愉快哟。

688IT编程网

python概念与术语_一些基本概念

发表评论

推荐文章

mongodb中match多个条件

纯数字正则表达式

zipkin tagquery用法

excel匹配正则 -回复

re正则匹配之findall

热门文章

java非负整数正则表达式

js 动态生成整数范围的正则

z正整数校验规则

生成2位随机整数的正则表达式

大于等于0的整数的正则

大于指定整数的数字正则表达式

阿里云密码正则表达式

el-form 密码正则表达

js 密码正则表达式

php密码正则

excel字母正则 -回复

shell 中括号正则

sn明细正则表达式

字母对称的正则表达式

shell akw 正则表达式

hive中的正则表达式

密码数字字母符号混合 java 正则

正则数字字母组合

组织机构代码正则

8位密码的正则表达式

最新文章

mongodb中match多个条件

excel匹配正则 -回复

re正则匹配之findall

数据库正则匹配数字

ue 匹配数字正则

ireport常用正则表达式

标签列表

688IT编程网

python概念与术语_一些基本概念

发表评论

推荐文章

mongodb中match多个条件

纯数字正则表达式

zipkin tagquery用法

excel匹配正则 -回复

re正则匹配之findall

热门文章

java非负整数正则表达式

js 动态生成整数范围的正则

z正整数校验规则

生成2位随机整数的正则表达式

大于等于0的整数的正则

大于指定整数的数字 正则表达式

阿里云密码正则表达式

el-form 密码正则表达

js 密码 正则表达式

php密码正则

excel字母正则 -回复

shell 中括号 正则

sn明细正则表达式

字母对称的正则表达式

shell akw 正则表达式

hive中的正则表达式

密码 数字字母符号混合 java 正则

正则数字字母组合

组织机构代码正则

8位密码的正则表达式

最新文章

mongodb中match多个条件

excel匹配正则 -回复

re正则匹配之findall

数据库正则匹配数字

ue 匹配数字 正则

ireport常用正则表达式

标签列表

大于指定整数的数字正则表达式

js 密码正则表达式

shell 中括号正则

密码数字字母符号混合 java 正则

ue 匹配数字正则