perf 性能分析实战: 从硬件计数器到火焰图的完整工作流

perf 是 Linux 内核自带的性能分析利器,但多数开发者只停留在 perf top 层面。本文以嵌入式 ARM-Linux 实战为背景,从 PMU 硬件计数器原理出发,系统讲解 perf stat(IPC/缓存/分支预测)、perf record + 火焰图(On-CPU/Off-CPU)、perf sched(调度延迟)三大核心工作流,并给出 ARM 平台缓存访存分析方法和自动化监控脚本。

February 16, 2026 · 12 min · 2500 words · map[name:DeguiLiu]

perf lock 锁竞争诊断: 从 futex 原理到生产定位实战

以 perf lock 为主线的锁竞争诊断实战。从 Linux mutex 的三条路径(fast/mid/slow)和 futex 内核机制出发,详解 perf lock contention 的每个输出字段含义,演示调用栈分析、锁持有者追踪、类型过滤等进阶用法,通过一个完整案例展示从「发现 95% 竞争率」到「无锁架构 3.6x 吞吐提升」的诊断全过程。

February 16, 2026 · 6 min · 1241 words · map[name:DeguiLiu]