网站地图官方微信:
网站首页 辉埠镇 铅山县 滨湖镇 黄塘乡 古城区 黄河乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 为什么 macOS 并不差,可市场总敌不过 Windows? |

    我两个都用,有一天忽然想到一个问题,就苹果电脑的体量,愿意做...

    查看详情>>
  • | 你的亲戚提过什么过分的要求? |

  • | 为什么情侣在一起旅行后容易分手? |

  • | 一个人能做出什么开源项目? |

  • | 胸大的女孩子有什么烦恼? |

  • | 为什么长得漂亮却没什么用? |

  • | 自己组一个E5服务器才几百块钱,为什么去阿里云租这么贵? |

  • | 将 Windows Server 作为个人 PC 操作系统来用是怎样的体验? |

  • | 吃爽了是怎样一种体验? |

  • | 胸大的女孩会自卑 吗? |

  • | 如何评价首个女性友好的编程语言HerCode? |

  • 生下孩子两年后,捞女的代价来了。 6月是黄一鸣女儿闪闪两周...

    2025-06-21
  • 不不不,把python去掉,只用rust。 组合个毛线啊,...

    2025-06-21
  • 你要是信不过简中的话,你可以去翻翻繁中对印度的报道, 油管上...

    2025-06-21
  • 马克失魂落魄的这段日子,麦朵小妹妹短暂的温暖过他,但这束阳光...

    2025-06-21

关注我们

添加微信好友,关注最新动态