一张照片如何被压缩到十分之一:JPEG压缩技术的三十五年演进
一张未经压缩的24位真彩色照片,每像素需要3字节存储。以1200万像素的数码照片为例,原始数据量约为36MB。然而保存为JPEG格式后,这个数字往往能降到3MB左右,压缩比达到10:1甚至更高,而人眼几乎察觉不到画质损失。这种看似不可思议的数据压缩是如何实现的?答案藏在人类视觉系统的生理特性与一种诞生于三十五年前的数学变换之中。 ...
一张未经压缩的24位真彩色照片,每像素需要3字节存储。以1200万像素的数码照片为例,原始数据量约为36MB。然而保存为JPEG格式后,这个数字往往能降到3MB左右,压缩比达到10:1甚至更高,而人眼几乎察觉不到画质损失。这种看似不可思议的数据压缩是如何实现的?答案藏在人类视觉系统的生理特性与一种诞生于三十五年前的数学变换之中。 ...
引言:耳朵的"盲区" 把一个100MB的WAV文件压缩成5MB的MP3,声音听起来几乎一模一样。这听起来像是魔法,但它的本质是数学对人类感知的精确计算。音频压缩的核心问题不是"如何把数据变小",而是"人类到底能听到什么"。 ...
1982年,当索尼和飞利浦联合推出CD(Compact Disc)时,他们做出了两个看似随意的技术决定:44.1kHz的采样率和16位的量化深度。这两个数字从此定义了数字音频的四十年。为什么不是40kHz或50kHz?为什么是16位而不是20位?这背后是一连串精妙的数学权衡和工程妥协。 ...
当你按下Ctrl+C时,终端里的程序就停止了。这个每天都在发生的操作背后,是Unix操作系统最古老也最精妙的进程间通信机制——信号(Signal)。 ...
1978年,从苏黎世飞往波士顿的跨大西洋航班上,Amar Bose摘下了航空公司提供的耳机。他刚刚经历了一次令人沮丧的体验:为了在轰鸣的机舱里听清音乐,他把音量调到最高,结果耳膜被震得生疼,而引擎的轰鸣声依然清晰可闻。 ...
2001年5月,Michal Zalewski在他的论文《Delivering Signals for Fun and Profit》中展示了一个令人不安的例子:一个看似完全正确的信号处理函数,仅仅因为在错误的时间点被调用,就能让整个进程陷入不可恢复的死锁状态。没有内存泄漏,没有竞态条件,没有缓冲区溢出——程序只是停在那里,永远不再响应。 ...