视频编码的运动估计从整像素搜索到仿射预测的四十年算法博弈
一个4K视频帧包含超过800万个像素,而相邻两帧之间可能只有5%的像素发生了显著变化。如果不利用这种时间冗余,每秒60帧的4K视频需要大约12Gbps的原始带宽——这是任何网络都无法承受的。运动估计(Motion Estimation, ME)就是解决这个问题的核心技术,它通过在参考帧中寻找当前块的最佳匹配位置,将视频压缩效率提升一个数量级。 ...
一个4K视频帧包含超过800万个像素,而相邻两帧之间可能只有5%的像素发生了显著变化。如果不利用这种时间冗余,每秒60帧的4K视频需要大约12Gbps的原始带宽——这是任何网络都无法承受的。运动估计(Motion Estimation, ME)就是解决这个问题的核心技术,它通过在参考帧中寻找当前块的最佳匹配位置,将视频压缩效率提升一个数量级。 ...
引言:一个被误解的概念 2015年,一篇题为《SSD断电七天数据丢失》的文章在技术圈引发恐慌。文章引用了JEDEC委员会成员Alvin Cox的演示文稿,声称固态硬盘在断电后可能很快丢失数据。虽然SNIA后来澄清这是对规范的误读,但这个话题揭示了冷存储技术的核心困境:我们以为数据存进去就安全了,但存储介质从未停止老化。 ...
触摸刚拔下的充电器,那种温热甚至发烫的感觉几乎是每个智能手机用户的共同体验。当我们把手机从5W充电时代带入65W甚至120W快充时代,充电器也从小小的"豆腐块"变成了掌心大小的"砖头",发热问题愈发显著。这热量究竟从何而来?为什么更快意味着更烫?GaN充电器真的能解决发热问题吗?要回答这些问题,我们需要深入到半导体物理、电力电子和热力学的交叉领域。 ...
1995年,德国埃尔朗根的一间实验室里,Karlheinz Brandenburg 正在收听 Suzanne Vega 的歌曲《Tom’s Diner》。这不是普通的听歌——他正在调试一种新的音频压缩算法。这首歌人声清晰、伴奏简单,成为了测试编解码器的完美样本。当他终于找到一种方法,能让这段音频在不到原始文件十分之一的大小下依然保持"透明"音质时,他知道自己站在了数字音频革命的门槛上。 ...
按下手机的快门按钮,一张照片就诞生了。但在这不到一秒的时间里,发生了什么? 光线穿过镜头,撞击传感器表面。成千上万个微小的光电二极管同时工作,将光子转化为电子。这些电子经过放大、量化、处理,最终变成你看到的图像。 ...
1985年,英特尔发布386处理器时,4KB的页面大小是一个合理的选择。那时候一台电脑的内存不过几兆字节,4KB页面既能保证内存利用率,又不会给页表带来太大压力。四十年过去了,服务器内存已经从兆字节增长到太字节,增长了百万倍,但页面大小依然是4KB。这个遗留设计正在成为高性能系统的隐形瓶颈。 ...
2019年,GitHub收到了一个看似普通的GraphQL查询。这个查询只有几十行,结构清晰,语法正确。但GitHub的工程师很快发现,执行这个查询会导致服务器资源消耗呈指数级增长——理论上的最大返回数据量超过200亿条记录。这不是编码错误,而是GraphQL设计哲学中固有的安全困境。 ...