Transformer
原创
发布时间:2026-04-06 | 更新时间:2026-04-06
Transformer 是当前流行的大语言模型(Large Language Model)架构,是这轮 AI 变革的核心。
Transformer 模型由 Google Brain 团队于 2017 年提出,论文标题为《Attention Is All You Need》。
它是一种基于自注意力机制的编码器-解码器架构,不再用 RNN/LSTM/CNN。
Transformer 是当前流行的大语言模型(Large Language Model)架构,是这轮 AI 变革的核心。
Transformer 模型由 Google Brain 团队于 2017 年提出,论文标题为《Attention Is All You Need》。
它是一种基于自注意力机制的编码器-解码器架构,不再用 RNN/LSTM/CNN。