transformer以及BERT预训练模型-CFANZ编程社区

transformer以及BERT预训练模型

transformer应用分为上游任务与下游任务。

上游任务指训练一个预训练模型，下游任务指在自然语言处理中完成的实际任务，如情感分析，标记，机器翻译。

1.transformer模型：

transformer和LSTM区别：LSTM一个字一个字训练，transformer采用并行训练

transformer模型主要分为两大部分, 分别是编码器和解码器, 编码器负责把自然语言序列映射成为隐藏层(下图中第2步用九宫格比喻的部分), 含有自然语言序列的数学表达. 然后解码器把隐藏层再映射为自然语言序列, 从而使我们可以解决各种问题, 如情感分类, 命名实体识别, 语义关系抽取, 摘要生成, 机器翻译等等, 下面我们简单说一下下图的每一步都做了什么: