pytorch交叉熵损失函数的weight参数的使用--688IT编程网

pytorch交叉熵损失函数的weight参数的使⽤⾸先

必须将权重也转为Tensor的cuda格式；

然后

将该class_weight作为交叉熵函数对应参数的输⼊值。

class_weight = torch.FloatTensor([0.13859937, 0.5821059, 0.63871904, 2.30220396, 7.1588294, 0]).cuda()

补充：关于pytorch的CrossEntropyLoss的weight参数

⾸先这个weight参数⽐想象中的要考虑的多

你可以试试下⾯代码

import torch

as nn

inputs = torch.FloatTensor([0,1,0,0,0,1])

outputs = torch.LongTensor([0,1])

inputs = inputs.view((1,3,2))

outputs = outputs.view((1,2))

weight_CE = torch.FloatTensor([1,1,1])

ce = nn.CrossEntropyLoss(ignore_index=255,weight=weight_CE)

loss = ce(inputs,outputs)

print(loss)

tensor(1.4803)

这⾥的⼿动计算是：

loss1 = 0 + ln(e0 + e0 + e0) = 1.098

loss2 = 0 + ln(e1 + e0 + e1) = 1.86

求平均 = (loss1 *1 + loss2 *1)/ 2 = 1.4803

加权呢？

import torch

as nn

inputs = torch.FloatTensor([0,1,0,0,0,1])

outputs = torch.LongTensor([0,1])

inputs = inputs.view((1,3,2))

outputs = outputs.view((1,2))

weight_CE = torch.FloatTensor([1,2,3])

ce = nn.CrossEntropyLoss(ignore_index=255,weight=weight_CE)

loss = ce(inputs,outputs)

print(loss)

tensor(1.6075)

⼿算发现，并不是单纯的那权重相乘：

loss1 = 0 + ln(e0 + e0 + e0) = 1.098

loss2 = 0 + ln(e1 + e0 + e1) = 1.86

求平均 = (loss1 * 1 + loss2 * 2)/ 2 = 2.4113

⽽是

loss1 = 0 + ln(e0 + e0 + e0) = 1.098

loss2 = 0 + ln(e1 + e0 + e1) = 1.86

求平均 = (loss1 *1 + loss2 *2) / 3 = 1.6075

发现了么，加权后，除以的是权重的和，不是数⽬的和。

我们再验证⼀遍：

import torch

as nn

inputs = torch.FloatTensor([0,1,2,0,0,0,0,0,0,1,0,0.5])

outputs = torch.LongTensor([0,1,2,2])

inputs = inputs.view((1,3,4))

outputs = outputs.view((1,4))

weight_CE = torch.FloatTensor([1,2,3])

ce = nn.CrossEntropyLoss(weight=weight_CE)

# ce = nn.CrossEntropyLoss(ignore_index=255)

loss = ce(inputs,outputs)

print(loss)

tensor(1.5472)

⼿算：weight的搭配

loss1 = 0 + ln(e0 + e0 + e0) = 1.098

loss2 = 0 + ln(e1 + e0 + e1) = 1.86

loss3 = 0 + ln(e2 + e0 + e0) = 2.2395

loss4 = -0.5 + ln(e0.5 + e0 + e0) = 0.7943

求平均 = (loss1 * 1 + loss2 * 2+loss3 * 3+loss4 * 3) / 9 = 1.5472

可能有⼈对loss的CE计算过程有疑问，我这⾥细致写写交叉熵的计算过程，就拿最后⼀个例⼦的loss4的计算说明

以上为个⼈经验，希望能给⼤家⼀个参考，也希望⼤家多多⽀持。

688IT编程网

pytorch交叉熵损失函数的weight参数的使用

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

pytorch交叉熵损失函数的weight参数的使用

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式