内存序为何多线程程序需要六种不同的同步语义

一个看似简单的计数器,在多线程环境下却能暴露出计算机系统最深层的复杂性。当你写下x++这样的代码时,编译器可能将其重排序,CPU可能延迟写入,缓存一致性协议可能在不同核心间传递失效消息——这些操作并非恶意捣乱,而是现代处理器为了榨取每一分性能而精心设计的优化策略。 ...

8 min · 3811 words

协程调度:从用户态线程到Go GMP模型的二十年演进

1963年7月,Communications of the ACM发表了一篇题为《Design of a Separable Transition-Diagram Compiler》的论文。作者Melvin Conway提出了一个当时看来颇为新奇的概念:将编译器的词法分析阶段分解为多个"可以互相挂起和恢复"的执行单元。他将这些执行单元称为"coroutine"——协程。 ...

13 min · 6241 words

闭包捕获:为什么同一个循环变量在不同语言中行为截然不同

1964年,Peter Landin在一篇题为《The Mechanical Evaluation of Expressions》的论文中首次提出了"闭包"(closure)的概念。他将闭包定义为一个包含λ表达式及其相关环境的"信息束"。六十年后,这个概念几乎出现在所有现代编程语言中——JavaScript、Python、Rust、Go、Swift、C++、Java——但每种语言的实现方式却大相径庭。 ...

9 min · 4494 words

MESI协议:多核处理器如何在"看不见"彼此的情况下保持数据一致

1983年,James Goodman在IEEE COMPCON会议上发表了一篇题为《Using Cache Memory to Reduce Processor-Memory Traffic》的论文。这篇论文首次提出了"监听"(Snooping)的概念——让多个处理器通过监听共享总线上的事务来维护缓存一致性。当时的计算机界正处于从单处理器向多处理器过渡的关键时期,Goodman的发现为后来的对称多处理(SMP)系统奠定了基础。 ...

13 min · 6396 words

x86虚拟化的二十年突围:从「不可虚拟化」到云计算基石

1974年,ACM通讯发表了一篇题为《Formal Requirements for Virtualizable Third Generation Architectures》的论文。作者Gerald Popek和Robert Goldberg提出了一个看似简单的数学条件:一个处理器架构要支持"经典虚拟化",其所有敏感指令都必须是特权指令。 ...

14 min · 6924 words

CAP定理的误导性:为什么"三选二"是分布式系统被误解最深的公理

2000年7月,加州大学伯克利分校的Eric Brewer在ACM Symposium on Principles of Distributed Computing上做了一个主题演讲。他提出了一个看似简单的观点:分布式系统不可能同时提供一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)。 ...

10 min · 4812 words

Page Cache的阴暗面:为什么write()成功返回数据却可能消失

2009年3月,Ubuntu用户论坛上出现了一连串关于"ext4数据丢失"的报告。用户们描述了一个令人不安的现象:系统正常关机后重启,发现最近编辑的文件变成了零字节。这不是磁盘故障,不是恶意软件,而是Linux内核中一个精心设计的性能优化机制——延迟分配(delayed allocation)——在特定场景下的"副作用"。 ...

11 min · 5510 words