为什么你的耳朵会被骗:心理声学模型如何让音频压缩成为可能
引言:耳朵的"盲区" 把一个100MB的WAV文件压缩成5MB的MP3,声音听起来几乎一模一样。这听起来像是魔法,但它的本质是数学对人类感知的精确计算。音频压缩的核心问题不是"如何把数据变小",而是"人类到底能听到什么"。 ...
引言:耳朵的"盲区" 把一个100MB的WAV文件压缩成5MB的MP3,声音听起来几乎一模一样。这听起来像是魔法,但它的本质是数学对人类感知的精确计算。音频压缩的核心问题不是"如何把数据变小",而是"人类到底能听到什么"。 ...
1995年,德国埃尔朗根的一间实验室里,Karlheinz Brandenburg 正在收听 Suzanne Vega 的歌曲《Tom’s Diner》。这不是普通的听歌——他正在调试一种新的音频压缩算法。这首歌人声清晰、伴奏简单,成为了测试编解码器的完美样本。当他终于找到一种方法,能让这段音频在不到原始文件十分之一的大小下依然保持"透明"音质时,他知道自己站在了数字音频革命的门槛上。 ...