网站地图官方微信:
网站首页 河上镇 尚屯镇 武昌区 揭东区 安云乡 桃林乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 警犬知道自己是警犬么? |

    我舅舅领养过一只退役警犬,是他的同事有门路,把一只岁数大的了...

    查看详情>>
  • | 西安一商场大屏播放巨大电风扇,这真的能起到「望扇止暑」效果吗?还是单纯营销创意? |

  • | 通过重体力劳动练出来的肌肉和标准健美人员肌肉有什么不同? |

  • | 自己拥有一台服务器可以做哪些很酷的事情? |

  • | 哪张照片让你觉得刘亦菲美得不可方物? |

  • | 如何评价阿富汗取消与中国的石油开***合同? |

  • | 本人女20,平胸跟男生一样怎么办 ? |

  • | 如何评价微软的远程桌面? |

  • | 前端因为像素还原设计稿而离职,这是个别现象吗? |

  • | 女生穿小妈(后妈)裙是种什么体验? |

  • | DLM(扩散语言模型)会成为2025年的Mamba吗? |

  • 因为玩nas的真懂技术,小白占比无限接近0%. 其实品牌na...

    2025-06-22
  • Go往往跟Rust持平甚至超越这个观点是错误的,GO的性能很...

    2025-06-22
  • 坐标广州、95年、二本本科、双一流硕士、三甲医院临床一线岗位...

    2025-06-22
  • 核聚变是人类文明从1级突破到2级的关键,然而,当下我们的文明...

    2025-06-22

关注我们

添加微信好友,关注最新动态