transformer概念介绍--688IT编程网

transformer概念介绍

摘要：

1.Transformer 的整体结构

2.Transformer 的输入

3.Transformer 的工作流程

4.细节部分

4.1 单词 Embedding

4.2 位置 Embedding

4.3 Decoder 的输入

decoder正文：

Transformer 是一个非常强大的深度学习模型，广泛应用于语言翻译、文本生成等领域。本文将详细介绍 Transformer 的概念和结构。

1.Transformer 的整体结构

Transformer 由 Encoder 和 Decoder 两个部分组成，这两个部分各有 6 个 block。它的工作流程大体如下：首先，获取输入句子的每一个单词的表示向量 X，这个向量由单词的 Embedding 和单词位置的 Embedding 相加得到。然后，将得到的单词表示向量矩阵传入 Encoder 中，经过 6 个 Encoderblock 后可以得到句子所有单词的编码信息矩阵 C。再将 Encoder 输出的编码信息矩阵 C 传递到 Decoder 中，Decoder 依次会根据当前翻译过的单词 1~i 翻译下一个单词 i1。

2.Transformer 的输入

在 Transformer 中，单词的输入表示 x 由单词 Embedding 和位置 Embedding（PositionalEncoding）相加得到。单词的 Embedding 有很多种方式可以获取，例如可以采用 Word2Vec、Glove 等算法预训练得到，也可以在 Transformer 中训练得到。位置 Embedding 表示单词出现在句子中的位置，它可以帮助模型理解句子的语境。

3.Transformer 的工作流程

Transformer 的工作流程分为三步。第一步，获取输入句子的每一个单词的表示向量 X。第二步，将得到的单词表示向量矩阵传入 Encoder 中，经过 6 个 Encoderblock 后可以得到句子所有单词的编码信息矩阵 C。第三步，将 Encoder 输出的编码信息矩阵 C 传递到 Decoder 中，Decoder 依次会根据当前翻译过的单词 1~i 翻译下一个单词 i1。

4.细节部分

4.1 单词 Embedding：单词的 Embedding 有很多种方式可以获取，例如可以采用 Word2Vec、Glove 等算法预训练得到，也可以在 Transformer 中训练得到。

4.2 位置 Embedding：Transformer 中除了单词的 Embedding，还需要使用位置 Embedding 表示单词出现在句子中的位置，它可以帮助模型理解句子的语境。

4.3 Decoder 的输入：Decoder 的输入包括三个部分：Encoder 的输出、翻译开始符和掩码。翻译开始符用于表示一个新的翻译过程开始，而掩码用于遮盖住已经翻译过的单词，防止模型看到后面的单词。

688IT编程网

transformer概念介绍

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

transformer概念介绍

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式