网站地图官方微信:
网站首页 田楼镇 杜泽镇 半岗镇 渠江镇 庆元乡 多林镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 如何看待伊朗国家电视台发文称“今晚将会发生一件大事,让世界铭记几个世纪”? |

    伊朗这个推特是伊朗时间昨天(2025年6月17日)晚上8点半...

    查看详情>>
  • | 你为什么对kotlin失去好感? |

  • | 可以随身携带一个Linux系统吗? |

  • | iOS 26 的新设计被吐槽丑,苹果在设计更新时考虑了哪些因素?你对这一设计都有哪些评价? |

  • | Python+rust会是一个强大的组合吗? |

  • | 围棋比赛上有什么开始觉得很好笑,但是细思极恐的事? |

  • | 为什么现在都没人提起蛔虫了? |

  • | 维护一个大型开源项目是怎样的体验? |

  • | 网友称在桔子水晶酒店洗漱包内发现用过的四联检测盒,具体是怎么回事?酒店要承担哪些责任? |

  • | 曾经的班花,现在还多少人惦记? |

  • | 055一打一能不能打过阿利伯克? |

  • C语言中的「泛型」编程,这个代码是我在使用惯了C++之后转头...

    2025-06-21
  • 就一指挥系统而已 伊朗主力用的还是俄制雷达,没有从国内进口产...

    2025-06-21
  • 惨,老马实惨,惨不忍睹,都这样了,还在喊姐姐呢。 神机...

    2025-06-20
  • 我的头发到我屁股,夏天每三天洗一次。 洗头的顺序是先用控油...

    2025-06-21

关注我们

添加微信好友,关注最新动态