网站地图官方微信:
网站首页 罗阳镇 黄湾镇 高皇镇 翔云镇 文昌市 大具乡

当前位置: 首页 >

为什么我还是无法理解transformer?

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

  • | 四岁的女孩儿跳舞怕压腿,家长该坚持吗? |

    每次有家长痴迷练舞压腿练气质我就发这张图。 这大腿骨怎...

    查看详情>>
  • | 大家猜猜伊朗的结局如何? |

  • | 为什么女朋友觉得年入百万是很简单的事? |

  • | 为什么中国的高超音速导弹一款接一款的出,而美国却这么费劲? |

  • | 网络上那么多的站桩教程,到底哪种才适合初学者? |

  • | OpenAI 宣布使用 AMD 的 MI300 X 和 MI450 芯片,这两款芯片在技术上有何亮点? |

  • | 你们的腰突是怎么突然好的? |

  • | Windows有哪些神级软件? |

  • | 如何评价Electron? |

  • | 深圳大家都是怎么找对象呀? |

  • | Rust开发Web后端效率如何? |

  • 知道什么是腰肌劳损吗?不要随便给自己按病! 腰肌劳损这个词大...

    2025-06-23
  • 题主的问题描述里有最好能用到AI,这个开源混合型多模态AI搜...

    2025-06-23
  • 你们亲爱的“马亲王”写的东西不一直那德行吗? 十二时辰里,一...

    2025-06-23
  • 发小,重度抑郁,几度自杀未遂,熟人都知道是父母的原因,这里就...

    2025-06-23

关注我们

添加微信好友,关注最新动态