网站地图官方微信:
网站首页 新抚区 耿城镇 群龙乡 犁倭镇 六街镇 黑河镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | graalvm为啥国内没有流行起来,go写起来实在太恶心了,难道任凭go独霸云原生? |

    graalvm现在已经正儿八经能用了,也就是把一个大项目编译...

    查看详情>>
  • | 大家有没有「大众认为是烂片但个人却喜欢看」的影片? |

  • | 美国的制造业能回流成功吗? |

  • | 如何评价杨立昆认为大模型只是对海量文本的模式进行复杂拟合,根本不懂意义? |

  • | 《甄嬛传》有哪些微不足道的小人物令人印象深刻? |

  • | Windows有哪些神级软件? |

  • | 男朋友说我穿衣服太开放,难道好身材不应该显示出来吗? |

  • | 为什么 macOS 上国产软件不流氓? |

  • | 你捡过最大的漏是什么? |

  • | 如何评价邹市明妻子冉莹颖? |

  • | 你在出租房屋发现过什么前租客留下的“宝藏”? |

  • 在桌面应用开发的漫长历史中,我们见证了技术范式的演进:从 j...

    2025-06-28
  • 我玩魔兽世界。 某天在路上捡了一个野生萌新。 可把我稀罕...

    2025-06-28
  • Solid 很灵活。 它没有和 Web 绑死,没有和特殊的编...

    2025-06-28
  • 虫族最大的优势就是,可以不计小虫成本,实行统一思想,通过蜂巢...

    2025-06-28

关注我们

添加微信好友,关注最新动态