2013年,国际电信联盟(ITU-T)和国际标准化组织(ISO/IEC)联合发布了新一代视频编码标准H.265/HEVC(High Efficiency Video Coding)。理论上,HEVC比其前任H.264节省约50%的带宽,这对于正在爆炸式增长的4K视频流媒体来说简直是雪中送炭。然而十多年过去了,H.264依然稳坐主流编码的宝座,而HEVC却在专利授权的泥潭中举步维艰。
这段历史远不止是技术规格的迭代——它是一场持续四十年的商业博弈,涉及标准组织、专利持有者、流媒体巨头和硬件厂商的多方角力。要理解HEVC为何"输在起跑线上",必须回到视频编码标准化的起点。
从DCT说起:视频压缩的技术根基
视频压缩的核心思想并不复杂:找到并消除冗余。时间冗余(相邻帧之间的相似性)、空间冗余(同一帧内相邻像素的相似性)、编码冗余(某些值出现频率更高)、视觉冗余(人眼对某些细节不敏感)——这四类冗余构成了压缩算法的攻击目标。
1974年,堪萨斯州立大学的Nasir Ahmed教授提出了离散余弦变换(DCT)。这个数学工具能够将图像从空间域转换到频率域,把能量集中在少数低频系数上,为后续的量化和压缩铺平道路。JPEG、MPEG、H.26x——此后几乎所有的图像和视频编码标准都以DCT为基石。
1988年,ITU-T发布了第一个视频编码标准H.261,目标是在64kbps到2Mbps的带宽上实现视频会议。H.261定义了视频编码的基本框架:帧间预测(利用时间冗余)、变换编码(DCT)、量化、熵编码。这个框架沿用至今,变化的是每个环节的复杂度和精度。
MPEG的诞生:跨行业标准的诞生
同一时期,另一个标准组织正在酝酿。1988年1月,在哥本哈根的一次会议上,ISO/IEC旗下的Moving Picture Experts Group(MPEG)正式成立。创始成员Leonardo Chiariglione后来回忆,MPEG的诞生"违背了所有逻辑"——当时媒体标准化被ITU(视频通信和语音)、IEC(音频和电视)、ISO(摄影和电影)牢牢把控,一个小小的专家组凭什么突围?
答案在于跨行业的视野。Chiariglione意识到,电信基础设施的迭代周期与媒体市场需求严重脱节。消费电子厂商需要国际标准来推动产品普及,而电信和广播公司则需要现成的技术来提供服务。MPEG的使命就是把这两股力量拧在一起。
1993年,MPEG-1成为第一个成果。它瞄准1.5Mbps的CD-ROM存储,支持352×288像素的视频分辨率——在今天看来简陋不堪,但在当时足以颠覆整个行业。MPEG-2紧随其后(1995年),将分辨率推至标清和高清,成为DVD和数字电视广播的标准。这两代标准奠定了MPEG的江湖地位,也埋下了专利授权的种子。
H.264的黄金时代
2003年,ITU-T VCEG和ISO/IEC MPEG联合发布了H.264/AVC(Advanced Video Coding)。这是两个组织首次深度合作的成果,标准号在ITU体系下是H.264,在ISO体系下是MPEG-4 Part 10。
H.264的成功堪称教科书级别。相比MPEG-2,它在相同画质下节省约50%的带宽;相比H.263,节省约40%。更关键的是,专利授权相对清晰——MPEG LA(现为Via Licensing Alliance)统一管理着大部分必要专利,形成了一个可预测的费率体系:设备制造商按出货量付费,内容分发商在达到一定规模后才需付费,且存在费用上限。
这种"一站式授权"的模式降低了市场准入门槛。硬件厂商愿意集成H.264解码器,软件开发商愿意支持H.264编码,流媒体平台愿意采用H.264分发内容。YouTube在2007年全面转向H.264,Netflix在2008年开始用H.264替代Flash视频,苹果在iPhone上力推H.264——一个良性循环就此形成。
到2010年代中期,H.264已经成为事实上的通用标准。从网络视频到蓝光光盘,从视频会议到监控系统,无处不在。MPEG LA的专利池管理了超过2300项专利,涉及数十家专利持有者,但费率结构清晰透明:每台设备0.20美元,封顶每年975万美元(2020年数据)。对于苹果、微软、谷歌这样的巨头,这是完全可以承受的成本。
HEVC的专利噩梦
HEVC的故事本该是H.264的延续。2010年,JCT-VC(Joint Collaborative Team on Video Coding)启动了HEVC的标准制定工作,目标是比H.264再节省50%的带宽。2013年标准发布时,这个目标基本达成——在相同画质下,HEVC确实只需要H.264一半的码率。
问题出在专利授权环节。HEVC的专利池没有像H.264那样由MPEG LA统一管理,而是分裂成了三个独立的专利池:MPEG LA、HEVC Advance(后更名为Access Advance)、以及Via Licensing。更糟糕的是,还有相当数量的专利持有者选择不加入任何专利池,直接向使用者单独授权或发起诉讼。
为什么会出现这种分裂?HEVC涉及的技术专利数量远超H.264。据统计,H.264基础版本约有690多族专利,而HEVC基础版本的专利超过3900族,涉及高通、三星、索尼、华为等众多厂商。专利池之间的利益分配无法达成共识,最终导致了三分天下的局面。
对于使用者来说,这意味着什么?假设你是一家流媒体公司,想要合法使用HEVC分发视频,你需要:
- 向MPEG LA支付设备端授权费用
- 向Access Advance支付内容分发费用(虽然2018年后免除了互联网流媒体费用)
- 向Via Licensing支付另一套费用
- 还要提防那些不加入任何专利池的"散户"突然发来律师函
2015年,HEVC Advance发布了极其激进的内容分发费率:按用户数收费,每个用户0.5%的内容费用。这意味着一个拥有1亿付费用户的流媒体平台,如果月费是10美元,每年要额外支付600万美元的HEVC专利费——这还不包括另外两个专利池的费用。虽然后来HEVC Advance在2018年取消了流媒体内容分发费,但信任已经破裂。
AV1的逆袭
就在HEVC深陷专利泥潭的同时,一场颠覆性的变革正在酝酿。
2010年2月,谷歌以约1.06亿美元收购了On2 Technologies,获得了VP8视频编码格式的所有权。2013年,谷歌发布了VP9,并将其用于YouTube。但VP9的压缩效率并不比HEVC更优,且生态建设相对薄弱。
真正的转折点出现在2015年9月。亚马逊、思科、谷歌、英特尔、微软、Mozilla和Netflix联合宣布成立开放媒体联盟(Alliance for Open Media,AOMedia)。这个联盟的目标明确:开发免版税的下一代视频编码格式。
AOMedia的成员阵容耐人寻味。谷歌贡献了VP9作为技术基础,思科贡献了Thor编码器中的一些技术,Mozilla和Xiph.org贡献了Daala项目的创新。更重要的是,联盟成员本身拥有大量专利——苹果(2018年加入)、微软、谷歌、英特尔、亚马逊、Netflix——他们可以把各自的专利放入AOMedia的专利池,形成一道防御性的"专利墙"。
2018年3月,AV1正式发布。从技术角度看,AV1是一个相当先进的编码格式:
- 支持更高精度的帧内预测(多达56种方向模式,远超HEVC的35种)
- 引入了约束方向增强滤波器(CDEF),有效去除块效应
- 提供胶片颗粒合成(Film Grain Synthesis),在压缩时保留电影质感
- 原生支持10bit和12bit色深,更适合HDR内容
更重要的是,AV1承诺免版税。任何人都可以自由使用、实现和分发AV1编码器和解码器,无需支付专利费用。
当然,AV1并非完美。它的编码复杂度极高——早期版本的编码速度比HEVC慢约10-100倍。但随后出现的SVT-AV1编码器大幅改善了这个问题,使得软件实时编码成为可能。
硬件支持方面,AV1起初落后于HEVC。但到2023-2024年,情况发生了根本性转变:
- 英特尔从第11代酷睿(Tiger Lake)开始支持AV1解码
- AMD从RDNA 2架构开始支持AV1解码,RDNA 3支持编码
- 英伟达从RTX 30系列开始支持AV1解码,RTX 40系列支持编码
- 苹果在2023年发布的M3、A17 Pro芯片中加入了AV1硬件解码支持
流媒体的选择
Netflix是AV1最积极的推动者之一。根据2025年12月的数据,AV1已经支撑了Netflix约30%的流媒体播放。更重要的是,Netflix报告称AV1会话比H.264和HEVC节省约三分之一的带宽,同时减少了45%的缓冲中断。考虑到Netflix每月传输数百PB的视频流量,这种节省意味着巨大的成本优势。
YouTube也在逐步扩大AV1的覆盖率。截至2025年初,约50%的YouTube视频支持AV1编码,且AV1流的码率比VP9低约25%。
但HEVC并非毫无立足之地。苹果在iOS和tvOS生态中坚定支持HEVC,原因很简单:苹果本身就是HEVC专利池的重要贡献者,且已经为这些专利支付了费用。对于苹果来说,推广HEVC不会产生额外的专利成本。
中国的情况又有所不同。中国自主研发的AVS系列标准(AVS+、AVS2、AVS3)在国内市场占有一定份额。AVS2对标H.264,AVS3对标HEVC,且费率更低——这是中国在视频编码领域的专利突围尝试。2007年,AVS标准的出现迫使MPEG LA将H.264在中国区的授权费用降至每台设备0.10美元,这本身就是一个胜利。
技术演进背后的商业逻辑
视频编码领域出现了一个有趣的现象:技术越来越先进,但商业推广越来越困难。
MPEG-2时代,专利持有者相对集中,MPEG LA一家独大,授权简单直接。H.264时代,专利池依然统一,但参与者增多,费率结构稍显复杂。到了HEVC时代,专利池分裂,授权成本和风险都急剧上升。
这并非偶然。视频编码技术的进步意味着更复杂的算法和更多的专利。每一代新标准都吸引了更多的技术贡献者,每个人都想分一杯羹。当专利持有者无法就利益分配达成一致时,分裂就在所难免。
AOMedia的出现是一种制度创新。通过将专利持有者、内容提供商、硬件厂商和软件开发商纳入同一个联盟,AOMedia创造了一种"合作共赢"的机制:专利持有者放弃版税收入,换取更快的采用速度;内容提供商节省带宽成本;硬件厂商获得新的卖点;软件开发商减少法律风险。
H.266/VVC的未来
2020年7月,ITU-T和ISO/IEC发布了H.266/VVC(Versatile Video Coding)。相比HEVC,VVC在相同画质下可以再节省约50%的带宽,特别针对8K视频和VR内容进行了优化。
但VVC面临的挑战比HEVC更严峻。首先,编码复杂度更高——VVC的编码时间大约是HEVC的10倍。其次,专利授权问题依然悬而未决。虽然Access Advance(已收购Via Licensing的HEVC/VVC项目)试图建立一个统一的专利池,但历史教训让很多公司持观望态度。
更重要的是,市场留给VVC的时间窗口正在关闭。当硬件厂商已经在AV1上投入巨资时,是否有意愿再支持另一个编码格式?当流媒体平台已经建立了AV1的编码管线时,是否愿意再迁移到VVC?
尾声
回顾视频编码四十年的演进历程,一个清晰的脉络浮现出来:技术的进步是线性的,但商业模式的适应是曲折的。
DCT和运动估计奠定了技术基础,H.261和MPEG-1验证了标准化的价值,H.264展示了专利池管理的成功模式,HEVC揭示了专利分裂的风险,AV1则提供了一种新的可能性——免版税标准。
对于开发者和技术决策者而言,选择编码格式不再仅仅是技术问题。带宽成本、硬件支持、专利风险、生态系统成熟度——所有这些因素都需要权衡。在可见的未来,H.264、HEVC和AV1很可能会长期共存,各自服务于不同的场景。
视频编码的故事还在继续。下一个转折点会是什么?也许是AV2,也许是深度学习编码器的成熟,又或者是专利制度的根本性改革。唯一确定的是,技术演进与商业博弈的纠缠将一直持续下去。
参考资料
- Richardson, I. E. (2004). H.264 and MPEG-4 Video Compression: Video Coding for Next-generation Multimedia. John Wiley & Sons.
- Ohm, J. R., et al. (2012). Comparison of the Coding Efficiency of Video Coding Standards—Including High Efficiency Video Coding (HEVC). IEEE Transactions on Circuits and Systems for Video Technology, 22(12), 1669-1684.
- Sze, V., Budagavi, M., & Sullivan, G. J. (2014). High Efficiency Video Coding (HEVC): Algorithms and Architectures. Springer.
- Grois, D., et al. (2013). Performance Comparison of H.265/MPEG-HEVC, VP9, and H.264/MPEG-AVC Encoders. Picture Coding Symposium (PCS 2013).
- Valin, J. M., et al. (2018). A Technical Overview of AV1. Applications of Digital Image Processing XLI.
- Chiariglione, L. (2019). The true history of MPEG’s first steps. Leonardo’s Blog.
- Netflix Technology Blog. (2025). AV1 — Now Powering 30% of Netflix Streaming.
- AOMedia. (2015). Alliance for Open Media Established to Deliver Next-Generation Open Media Formats.
- Access Advance LLC. HEVC Advance Patent Pool Licensing Terms.
- MPEG LA. AVC/H.264 Patent Portfolio License.
- Wikipedia. Discrete Cosine Transform. https://en.wikipedia.org/wiki/Discrete_cosine_transform
- Vcodex. Historical Timeline of Video Coding Standards and Formats. https://www.vcodex.com/historical-timeline-of-video-coding-standards-and-formats
- Fraunhofer HHI. H.266/VVC Official Page. https://www.hhi.fraunhofer.de/en/departments/vca/technologies-and-solutions/h266-vvc.html
- 中国信通院. (2025). 视频编解码领域标准必要专利及标准提案研究报告.
- Streaming Media Magazine. Multiple articles on HEVC licensing and AV1 adoption.