网站地图官方微信:
网站首页 梁溪区 大东镇 城南镇 毕桥镇 广武镇 里洞镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 为什么水泥封不住尸臭? |

    根本原因是普通水泥硬化不够快。 普通硅酸盐水泥,终凝时间大...

    查看详情>>
  • | 为什么一部分 Go 布道师的博客不更新了? |

  • | 你在国产电影或电视剧里见过哪些脱离实际生活的离谱设定? |

  • | Linux 内核的系统有没有类似macOS 那样漂亮流畅的桌面环境的发行版本? |

  • | 如何看待国内服装尺码越来越小的现象? |

  • | 为什么不用rust重写Nginx? |

  • | 你怎么看待剪映收费过高问题? |

  • | 养乌龟生态缸到底可行吗? |

  • | obsidian用一两年后会有多大?全文搜索还快吗? |

  • | 按理说生存和繁衍是生物的本能,为什么还有那么多人不愿意生孩子啊? |

  • | 为什么 Windows 没有比较成熟的第三方桌面环境(explorer.exe)? |

  • “618电商大战”的前夜,6月17日晚上,京东集团创始人、董...

    2025-06-23
  • 以前跟部队有业务关系,去部队玩的时候打过67式和89式。 ...

    2025-06-23
  • 你说的是那个 笔芯悠悠 么? 在B站叫 ***千代 。 退...

    2025-06-23
  • 不会是湖南交通工程学院的吧,答辩现场老师当场反驳了一个学生j...

    2025-06-23

关注我们

添加微信好友,关注最新动态