[深度学习]半监督学习、无监督学习之Autoencoders自编码器(附代码...--688IT编程网

[深度学习]半监督学习、⽆监督学习之Autoencoders⾃编码器

（附代码）

⽬录

⾃编码器介绍

⾃编码器的结构简单，由Encoder和Decoder组成，Encoder产⽣的Latent variables是潜在变量，它是Decoder的输⼊。

⾃编码器的⽬标是寻有意义的feature，⽤这些feature来代表输⼊变量，并且可以通过Decoder还原变量。

如果具体到某⼀个数据集MINIST，他的结构如下图所⽰，中间代表了卷积⽹络层或者全连接层。

PCA与⾃编码器对⽐：

⾃编码器更接近真实图像，因为它可以是⾮线性的。

⾃编码器与分类⽹络相⽐：

⾃编码器没有额外的label，属于⽆监督学习，⽽分类⽹络需要label，属于监督学习。

从零开始训练⾃编码器

数据集是MINIST，基于python的pytorch框架。

import os

import torch

as nn

functional as F

# Parameter Settings

latent_dims = 10

num_eopchs = 50

batch_size = 64

capacity = 64

learning_rate = 1e-3

# use_gpu = True

use_gpu = False

# MNIST Data Loading

ansforms as tranforms

from torch.utils.data import DataLoader

from torchvision.datasets import MNIST

decoderimg_transform = tranforms.Compose([

tranforms.ToTensor(),

tranforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))

])

train_dataset = MNIST(root='./data/MINIST', download=True, train=True, transform=img_transform)

train_dataloader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)

test_dataset = MNIST(root='./data/MINIST', download=True, train=False, transform=img_transform)

test_dataloader = DataLoader(test_dataset, batch_size=batch_size, shuffle=True)

# Autoencoder Definition

class Encoder(nn.Module):

def __init__(self):

super(Encoder, self).__init__()

c = capacity

def forward(self, x):

x = F.v1(x))

x = F.v2(x))

x = x.view(x.size(0), -1) # flatten batch of multi-channel feature maps to a batch of feature vectors

x = self.fc(x)

return x

class Decoder(nn.Module):

def __init__(self):

super(Decoder, self).__init__()

c = capacity

self.fc = nn.Linear(in_features=latent_dims, out_features=c * 2 * 7 * 7)

def forward(self, x):

x = self.fc(x)

x = x.view(x.size(0), capacity * 2, 7,

7) # unflatten batch of feature vectors to a batch of multi-channel feature maps

x = F.v2(x))

x = torch.v1(x)) # last layer before output is tanh ,since the images are normalized and 0-centered return x

class Autoencoder(nn.Module):

def __init__(self):

super(Autoencoder, self).__init__()

self.decoder = Decoder()

def forward(self, x):

latent = der(x)

x_recon = self.decoder(latent)

return x_recon

autoencoder = Autoencoder()

device = torch.device("cuda:0" if use_gpu and torch.cuda.is_available() else "cpu")

autoencoder = (device)

num_params = sum(p.numel() for p in autoencoder.parameters() quires_grad)

print('Number of parameters:%d' % num_params)

# Train Autoencoder

optimizer = torch.optim.Adam(params=autoencoder.parameters(), lr=learning_rate, weight_decay=1e-5)

# set to training mode

train_loss_avg = []

print('')

for epoch in range(num_eopchs):

train_loss_avg.append(0)

num_batches = 0

for img_batch, _ in train_dataloader:

img_batch = (device)

# autoencoder reconstruction

img_batch_recon = autoencoder(img_batch)

# reconstrcution error

loss = F.mse_loss(img_batch_recon, img_batch)

# backpropagation

<_grad()

loss.backward()

# one step of the optimizer(using the gradients form backpropagation)

optimizer.step()

train_loss_avg[-1] += loss.item()

num_batches += 1

train_loss_avg[-1] /= num_batches

print("Epoch [%d / %d] average reconstruction error:%f" % (epoch + 1, num_eopchs, train_loss_avg[-1]))验证模型训练结果

# Evaluate on The Set

# set to evalution mode

autoencoder.eval()

test_loss_avg, num_batches = 0, 0

for img_batch, _ in train_dataloader:

img_batch = (device)

# autoencoder reconstruction

img_batch_recon = autoencoder(img_batch)

# reconstrcution error

loss = F.mse_loss(img_batch_recon, img_batch)

test_loss_avg += loss.item()

num_batches += 1

test_loss_avg /= num_batches

print('average reconstruction error:%f' % (test_loss_avg))

可视化结果

688IT编程网

[深度学习]半监督学习、无监督学习之Autoencoders自编码器(附代码...

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

[深度学习]半监督学习、无监督学习之Autoencoders自编码器(附代码...

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式