MindStudio组合技,让Host Bound问题看得见、调得准
如下图4所示,可以看到async_task_queue连线(用于关联Python至CANN的任务下发关系)坡度非常大,这说明Python层的下发队列中有任务,但是一直没有下发,造成大约3.2ms的空泡。图6可以看得更清楚。某Linux服务器,已经发现了性能膨胀和Host侧空泡问题,但是仅仅从Profiling数据,无法判断真实原因,缺少对于Host侧的性能分析手段。以卡3为例,其Host To Device连线坡度逐渐垂直,说明卡3 Host侧下发任务较慢,Device侧出现空转,导致硬件资源浪费。