基于鲲鹏BRBE(Branch Record Buffer Extension)特性的性能分析与优化
鲲鹏平台的BRBE是一项硬件级别的分支记录技术,旨在提供低开销、高效率的代码执行路径捕获能力。它类似于x86架构中的LBR(Last Branch Record),为开发者提供了强大的性能分析与优化能力,它们的基本原则是相同的:硬件记录每个分支的from、to地址以及一些额外数据(例如时延)。具体来说,func1() → func2() → func3()显然是占用时钟周期最长的调用路线,其主要耗时集中在 func3(),占比 50.67%,因此整条路线的性能瓶颈即为此处,符合程序本身的结构。