MySQL

从崩溃到恢复：数据库检查点机制如何让 WAL 不再是无底洞

1970年代，当第一个关系数据库系统还在襁褓中时，工程师们就面临一个根本性的矛盾：内存速度快但易失，磁盘可靠但缓慢。一个事务提交后，如何保证数据在断电瞬间不会丢失？如何让数据库在崩溃后能快速恢复到一致状态？这些问题的答案，催生了数据库领域最基础也最精妙的设计——预写日志（Write-Ahead Log，WAL）与检查点（Checkpoint）机制。 ...

数据库Join算法如何将万亿级比较降至线性复杂度：从嵌套循环到哈希连接的四十年技术博弈

1970年，Edgar Codd在IBM发表关系模型论文时，可能没有预见到Join操作会成为此后五十年数据库性能优化的核心战场。一个看似简单的"将两张表按共同键合并"的操作，在算法层面却隐藏着从$O(m \times n)$到$O(m + n)$的巨大差异——对于两张各有100万行的表，这意味着从万亿次比较降到百万次，性能差距可达六个数量级。 ...

数据库已提交的事务为何会丢失？从fsync到异步提交的持久性权衡

数据库教科书告诉开发者一个简单的承诺：事务一旦提交，数据就是持久的。ACID中的"D"代表Durability——持久性。但生产环境中的实际情况远比教科书复杂：同样配置了主从复制、同样使用了SSD存储、同样收到了COMMIT成功的返回码，断电重启后，有些数据确实完好无损，有些却凭空消失了。 ...

读写分离为何总在关键时刻掉链子：从复制延迟到写后读一致性的技术突围

用户在社交平台上发布了一条评论，刷新页面后评论消失了。再刷新一次，评论又出现了。用户困惑：我的评论到底保存成功了没有？这不是偶发的bug。在生产环境中，这类问题每天都在发生。根因往往指向同一个架构决策：读写分离。 ...

事务隔离级别为何成为数据库最被误解的概念

医院值班系统中，两位医生同时尝试放弃自己的值班班次。每个医生在操作前都会检查：是否至少还有另一位医生在值班？检查结果都显示"是"，于是两人都放心地提交了更新。最终结果：当晚没有任何医生值班。 ...

写倾斜异常：为什么可重复读隔离级别还是会出现一致性问题

1995年，IBM 的研究人员发表了一篇名为"A Critique of ANSI SQL Isolation Levels"的论文。这篇论文指出了 ANSI SQL 标准对事务隔离级别定义的模糊性，并引入了一个在当时鲜为人知的异常现象：写倾斜（Write Skew）。近三十年后，这个概念仍然是数据库领域最容易被误解的问题之一。 ...

你的索引为什么救不了慢查询？从B+树结构到优化器决策的完整解析

你花了两小时设计了一套"完美"的索引方案：where条件列建了索引，排序字段建了索引，连join的列都建了索引。上线第一天，监控系统就开始报警——那条"应该很快"的查询，执行时间飙到了30秒。 ...