SIMD向量化:为什么一行代码能让性能提升10倍

2019年,Daniel Lemire和Geoff Langdale发表了一篇论文,展示了一个令人惊讶的结果:他们的JSON解析器simdjson在单核上达到了每秒解析数GB JSON数据的速度,比当时最快的C++ JSON库快了4倍。这个性能飞跃的核心秘诀只有一个——SIMD向量化。 ...

14 min · 6881 words

数据库查询引擎为何跑不过手写代码?从火山模型到编译执行的三十年突围

2008年,一位数据库研究员做了一个简单的实验:他用C++手写了一段处理TPC-H Query 1的代码,然后与当时最先进的数据库系统对比性能。结果令人震惊——手写代码比数据库快了整整一个数量级。这个结果刺痛了数据库社区:为什么精心设计的查询引擎,竟然输给了几行手写的循环? ...

9 min · 4500 words