包管理器的依赖解析为何如此困难:从NP完全问题到SAT求解器的二十年算法博弈

2016年3月22日,一个名为Azer Koçulu的程序员删除了他在npm上发布的273个包。其中一个叫left-pad的包只有11行代码,功能简单到令人发指——在字符串左侧填充空格。然而,这个微不足道的包被Babel、React、Webpack等数千个项目依赖。几小时内,全球JavaScript开发者的构建流水线开始大规模崩溃,Facebook、PayPal、Netflix、Spotify等公司的开发团队陷入混乱。 ...

12 min · 5661 words

SQLite为何能征服世界:从三位开发者的固执到一万亿数据库实例的技术传奇

2000年5月29日,D. Richard Hipp开始编写一个嵌入式数据库引擎。他的动机很务实:作为通用动力公司的承包商,他正在为美国海军的奥斯卡·奥斯汀号驱逐舰开发软件。军舰上的程序需要一个本地数据库,但传统的客户端-服务器数据库在这个场景下有一个致命缺陷——如果数据库服务器进程崩溃,整个应用程序就会瘫痪。 ...

11 min · 5481 words

数据库已提交的事务为何会丢失?从fsync到异步提交的持久性权衡

数据库教科书告诉开发者一个简单的承诺:事务一旦提交,数据就是持久的。ACID中的"D"代表Durability——持久性。但生产环境中的实际情况远比教科书复杂:同样配置了主从复制、同样使用了SSD存储、同样收到了COMMIT成功的返回码,断电重启后,有些数据确实完好无损,有些却凭空消失了。 ...

13 min · 6186 words

B+树索引的页分裂:从顺序插入的优雅到随机写入的代价

一个简单的测试揭示了令人困惑的现象:同样的硬件、同样的表结构、同样的索引设计,使用UUID作为主键的表插入速度只有自增主键的十分之一。更奇怪的是,存储空间的占用竟然相差接近一倍。 ...

10 min · 4619 words

IPv6普及为何如此缓慢从NAT的权宜之计到双栈运维的二十年困境

2011年2月3日,迈阿密一场特别的仪式上,ICANN将最后五个/8的IPv4地址块分配给全球五大区域互联网注册管理机构(RIR)。这意味着,IANA掌管的IPv4地址池正式耗尽。当时的预测是:IPv6将在数年内成为主流。 ...

14 min · 6685 words

为什么83%的数据迁移项目都失败了从双写困境到CDC的技术突围

2013年,Target进军加拿大市场,133家门店同时开业。短短两年后,这家美国零售巨头黯然退出加拿大,累计损失超过21亿美元。根本原因之一是库存数据迁移的灾难性失败——货架上的商品和系统里的记录完全对不上,顾客在结账时发现价格与标签不符,仓库里堆满了系统显示"缺货"的商品。 ...

13 min · 6202 words

读写分离为何总在关键时刻掉链子:从复制延迟到写后读一致性的技术突围

用户在社交平台上发布了一条评论,刷新页面后评论消失了。再刷新一次,评论又出现了。用户困惑:我的评论到底保存成功了没有? 这不是偶发的bug。在生产环境中,这类问题每天都在发生。根因往往指向同一个架构决策:读写分离。 ...

11 min · 5107 words