Pytorch如何实现常用正则化--688IT编程网

Pytorch如何实现常⽤正则化

Stochastic Depth

论⽂：

本⽂的正则化针对于ResNet中的残差结构，类似于dropout的原理，训练时对模块进⾏随机的删除，从⽽提升模型的泛化能⼒。

对于上述的ResNet⽹络，模块越在后⾯被drop掉的概率越⼤。正则化解决过拟合

作者直觉上认为前期提取的低阶特征会被⽤于后⾯的层。

第⼀个模块保留的概率为1，之后保留概率随着深度线性递减。

对⼀个模块的drop函数可以采⽤如下的⽅式实现：

def drop_connect(inputs, p, training):

""" Drop connect. """

if not training: return inputs # 测试阶段

batch_size = inputs.shape[0]

keep_prob = 1 - p

random_tensor = keep_prob

random_tensor += torch.rand([batch_size, 1, 1, 1], dtype=inputs.dtype, device=inputs.device)

# 以样本为单位⽣成模块是否被drop的01向量

binary_tensor = torch.floor(random_tensor)

# 因为越往后越容易被drop，所以没有被drop的值就要通过除keep_prob来放⼤

output = inputs / keep_prob * binary_tensor

return output

在Pytorch建⽴的Module类中，具有forward函数

可以在forward函数中进⾏drop：

def forward(self, x):

x=...

if stride == 1 and in_planes == out_planes:

if drop_connect_rate:

x = drop_connect(x, p=drop_connect_rate, aining)

x = x + inputs # skip connection

return x

主函数：

for idx, block in enumerate(self._blocks):

drop_connect_rate = self._global_params.drop_connect_rate

if drop_connect_rate:

drop_connect_rate *= float(idx) / len(self._blocks)

x = block(x, drop_connect_rate=drop_connect_rate)

补充：pytorch中的L2正则化实现⽅法

搭建神经⽹络时需要使⽤L2正则化等操作来防⽌过拟合，⽽pytorch不像TensorFlow能在任意卷积函数中添加L2正则化的超参，那怎么在pytorch中实现L2正则化呢？

⽅法如下：超级简单！

optimizer = torch.optim.Adam(net.parameters(), lr=0.001, weight_decay=5.0)

torch.optim.Adam()参数中的 weight_decay=5.0 即为L2正则化（只是pytorch换了名字），其数值即为L2正则化的惩罚系数，⼀般设置为1、5、10（根据需要设置，默认为0，不使⽤L2正则化）。

注：

pytorch中的优化函数L2正则化默认对所有⽹络参数进⾏惩罚，且只能实现L2正则化，如需只惩罚指定⽹络层参数或采⽤L1正则化，只能⾃⼰定义。。。

以上为个⼈经验，希望能给⼤家⼀个参考，也希望⼤家多多⽀持。

688IT编程网

Pytorch如何实现常用正则化

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

688IT编程网

Pytorch如何实现常用正则化

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式 最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

nginx map用法正则

shell 正则表达式最后一行