网站地图官方微信:
网站首页 旧县乡 丹洲乡 大鹏镇 茶扎乡 热打乡 三村乡

当前位置: 首页 >

为什么我还是无法理解transformer?

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

  • | Win11真的比Win10好多了吗? |

    作为从95开始用的老人说下看法: 1。 95、98很经典,历...

    查看详情>>
  • | 目前最具性价比的全栈路线是啥? |

  • | 我听说Windows12微软就直接重头构建Windows了,就直接重构Win内核了,到底是不是真的? |

  • | 女生怎么穿才算暴露吗? |

  • | UFC冠军有多厉害? |

  • | 为什么m4max可以轻松堆128g显存,nvidia消费端显卡却长期被限制在24g? |

  • | 未来几年,市场对 AI 人才的需求会集中在哪几个方向? |

  • | 鱼缸能不能做到一直不换水还很清澈? |

  • | 为什么我身边的女同学生活那么好还成了恨国党? |

  • | 腾讯游戏究竟祸害了多少人? |

  • | 如何评价《一人之下》第722(765)话情报? |

  • 原来人可以过的这么好,东京肯德基店员一小时工资1400日元(...

    2025-06-27
  • 最近发现两个有意思的现象。 一个是从25年开始,AI智能体...

    2025-06-27
  • 其实,就在于舍不舍得花钱。 这张图是很多人意识里的中国农村...

    2025-06-27
  • 最近三天晚上这辆电摩老是停我车位~~~ 第一天我刚好喝酒,代...

    2025-06-27

关注我们

添加微信好友,关注最新动态