ARMv8 CRC 性能实测: 硬件指令快 8 倍, NEON 反而更慢

对比两组实验: ARMv8 CRC32 硬件指令 (crc32cx) vs 软件查表法,以及 NEON SIMD vs 简单 C 循环的字节累加校验和。结果表明 CRC32 硬件指令比查表快 8 倍以上,而 NEON 手写的字节累加在 -O2 下反而比编译器自动优化的标量代码慢。

February 15, 2026 · 3 min · 609 words · map[name:DeguiLiu]

ARM-Linux 锁竞争性能实测: Spinlock/Mutex/ConcurrentQueue 对比

本文通过严格的基准测试方法,对比多线程高竞争场景下三种同步策略的性能表现:自旋锁 (atomic_flag)、互斥锁 (std::mutex) 和无锁队列 (moodycamel::ConcurrentQueue)。

February 15, 2026 · 4 min · 665 words · map[name:DeguiLiu]