Unix Domain Socket 实时性优化: 嵌入式 IPC 全链路调优

面向嵌入式 ARM-Linux 平台的 Unix Domain Socket 实时性优化系统指南。从 UDS 内核数据路径出发,覆盖 socket 类型选择(STREAM/DGRAM/SEQPACKET)、epoll 边缘触发正确实现、抽象命名空间、fd 传递零拷贝、memfd_create 大块数据传输、eventfd 轻量通知、实时调度与 CPU 隔离、内核缓冲区调优、io_uring 异步路径等维度。每项优化标注原理、ARM 特有注意事项和适用场景。附完整的 RAII 服务端实现。

February 16, 2026 · 10 min · 2110 words · map[name:DeguiLiu]

TCP 非阻塞发送的 Short Write 问题: 环形缓冲区 + epoll 事件驱动方案

非阻塞 TCP 发送的 short write 问题在高吞吐嵌入式场景下不可回避。本文从一个 CSDN 环形缓冲方案出发,逐项分析其 5 个工程缺陷 (非 2 幂、无界索引、内存泄漏、部分发送丢失、EAGAIN 误判),给出工程级改进方案: 2 的幂位掩码、精确 acquire-release 内存序、EPOLLOUT 驱动异步刷写,并对比 newosp SpscRingbuffer 的设计取舍。

February 16, 2026 · 9 min · 1854 words · map[name:DeguiLiu]

SPSC 无锁环形缓冲区设计剖析: 从原理到每一行代码的工程抉择

深度剖析 liudegui/ringbuffer 的 SPSC 无锁环形缓冲区实现。逐项解析缓存行对齐、2 的幂位掩码、wait-free 无重试设计、精确 acquire-release 内存序、FakeTSO 单核模式、批量 memcpy、ProducerClear 所有权修正等 12 项设计决策,每项标注 为什么这样做 和底层硬件原理。

February 16, 2026 · 10 min · 1955 words · map[name:DeguiLiu]

共享内存 IPC 实践: 从 POSIX shm 到 newosp 无锁 Ring Buffer

共享内存是 Linux 进程间通信中延迟最低的机制,但原始的 POSIX shm_open/mmap 接口缺少同步、生命周期管理和崩溃恢复。本文从 POSIX 共享内存原理出发,剖析 newosp 框架中 ShmRingBuffer 的 CAS 无锁设计、ARM 内存序加固、缓存行对齐等工程决策,并与 cpp-ipc 库进行架构对比,展示嵌入式场景下共享内存 IPC 的完整工程方案。

February 16, 2026 · 9 min · 1776 words · map[name:DeguiLiu]

嵌入式线程间消息传递重构: 用 MCCC 无锁消息总线替代 mutex + priority_queue

本文基于一个实际的线程间消息传递需求(Windows 风格的 SendMessage/PostMessage),分析传统 mutex + priority_queue + promise/future 方案的工程缺陷,然后用 MCCC 无锁消息总线重新实现,并通过完整的测试和 Sanitizer 验证。

February 16, 2026 · 7 min · 1422 words · map[name:DeguiLiu]

无锁编程核心原理: 从 CAS 原子操作到三种队列设计模式

无锁编程的基础性原理文章。从 CAS 原子操作的硬件实现出发,严格定义 lock-free 与 wait-free 的进展保证差异,深入分析 ABA 问题及其解决方案,阐明 acquire-release 内存序的必要性,最终以 SPSC/MPSC/MPMC 三种队列模式为主线,展示无锁数据结构从设计到工程落地的完整知识体系。

February 16, 2026 · 10 min · 2084 words · map[name:DeguiLiu]

多线程死锁与优先级反转实战: 从问题复现到工程解决方案

死锁与优先级反转的实战指南。通过 6 个可编译运行的 C++ 示例,复现经典 AB-BA 死锁、回调重入死锁、自死锁、优先级反转等场景,逐一给出工程修复方案(全局锁序、std::scoped_lock、try_lock 回退、PTHREAD_PRIO_INHERIT、无锁架构)。纠正「编译优化导致死锁」的常见误解。附 TSan/lockdep 检测方法。本文为实战篇,与姊妹篇《嵌入式系统死锁防御》形成互补。

February 16, 2026 · 10 min · 2042 words · map[name:DeguiLiu]

C++ 单例模式的线程安全实现: 从 DCLP 的历史缺陷到 C++11 的修复

双重检查锁定 (DCLP) 是 C++ 并发编程中最臭名昭著的模式之一。2004 年 Scott Meyers 和 Andrei Alexandrescu 论证了它在 C++03 中不可移植地安全实现。本文从 DCLP 的历史缺陷出发,解释 C++11 内存模型如何修复它,对比 Magic Statics、acquire/release 原子操作和顺序一致性三种实现,并讨论嵌入式场景下的工程选择。

February 16, 2026 · 7 min · 1361 words · map[name:DeguiLiu]

C/C++ 性能优化实战: 内存布局、分支预测与编译器调优

系统级性能优化不是微调指令,而是在编译器、数据布局、并发架构三个层面做出正确选择。本文从编译器内建函数、编译期多态替代虚函数、零堆分配热路径、缓存友好布局、无锁并发、Active Object 去锁化架构、行为树并行启动、实时调度八个方向,结合 newosp 基础设施库的实际代码,给出可落地的嵌入式 C/C++ 优化实践。

February 16, 2026 · 16 min · 3220 words · map[name:DeguiLiu]

ARM-Linux 网络性能优化实战: 从中断到零拷贝的全链路调优

面向 ARM-Linux 嵌入式系统的网络性能优化系统指南。从数据包接收全链路出发,覆盖 CPU 频率管理、中断亲和性与分流(RSS/RPS/RFS)、NAPI 轮询、Ring Buffer 调优、协议栈 sysctl 参数、硬件卸载(GRO/TSO/Checksum)、DMA 与零拷贝、Busy Polling 低延迟技术、XDP 快速路径、实时调度(SCHED_FIFO/PREEMPT_RT)等十余个维度的工程实践。每项优化均标注适用场景、ARM 特有注意事项和副作用。

February 16, 2026 · 10 min · 1933 words · map[name:DeguiLiu]

嵌入式 C++ 智能指针的五个陷阱与零堆分配替代方案

std::shared_ptr 和 std::weak_ptr 在桌面开发中是安全的默认选择,但在嵌入式实时系统中会引入原子引用计数开销、堆碎片化、不确定延迟和竞态条件等问题。本文从一个 weak_ptr 竞态 bug 出发,系统分析智能指针在嵌入式场景的五个根本陷阱,并展示 newosp C++17 基础设施库如何用 ObjectPool、FixedFunction、ScopeGuard 和 expected 实现零堆分配的确定性内存管理。

February 16, 2026 · 10 min · 1947 words · map[name:DeguiLiu]

嵌入式 C++17 设计模式实战: 零虚函数、零堆分配的编译期技术

传统设计模式依赖虚函数和动态分配,在嵌入式系统中代价过高。本文基于 newosp 库的真实代码,展示 8 种编译期设计模式的实现:类型擦除替代 std::function、ScopeGuard 替代虚析构、if constexpr 编译期分发、Tag Dispatch 构造控制、强类型包装、Pub/Sub 零堆回调、Visitor 直接分发、以及 CRTP 编译期 Handler 绑定。所有模式在 -fno-exceptions -fno-rtti 下可用,热路径零堆分配。

February 16, 2026 · 9 min · 1796 words · map[name:DeguiLiu]

嵌入式系统中的编译期分发: 用模板消除虚函数开销

结合 MISRA C++ 规范和 newosp 工程实践,系统阐述如何利用 C++17 模板技术实现编译期分发,在保持代码灵活性的同时消除虚函数的性能损耗。实测显示编译期分发相比回调模式有 15 倍性能提升,相比虚函数分发开销降低 95% 以上。

February 16, 2026 · 7 min · 1322 words · map[name:DeguiLiu]

C 语言设计模式实战: 策略模式与状态模式的本质差异

在没有面向对象语法的 C 语言中,策略模式和状态模式都通过函数指针表 (vtable) 模拟多态,代码结构几乎一致。本文从设计意图出发,用通用示例 (传感器滤波、通信协议状态机) 剖析二者的本质差异,并展示它们在同一系统中的协作方式。

February 16, 2026 · 7 min · 1439 words · map[name:DeguiLiu]

C 语言层次状态机框架: 从过程驱动到数据驱动的重构实践

以 state_machine 框架的重构为案例,展示如何将一个过程驱动的 C 语言状态机改造为数据驱动的层次状态机 (HSM)。涵盖转换表替代 switch-case、LCA 算法消除递归、用户缓冲区替代内部分配、守卫条件与内外转换区分等关键改造点,附完整数据结构和 API 设计。

February 16, 2026 · 7 min · 1487 words · map[name:DeguiLiu]