令牌化与加密的本质分歧：为何支付数据保护不能只靠密码学

2013年12月，美国零售商Target遭遇了一场改变支付安全行业格局的数据泄露事件。攻击者窃取了约4000万张信用卡和借记卡信息，另有7000万客户个人信息外泄。事后分析表明，攻击者从Point of Sale（POS）系统中直接提取了明文主账号（Primary Account Number，PAN）。如果这些系统当时使用了令牌化技术，即使攻击者完全攻破网络，他们能获取的也只是一堆毫无价值的随机字符串。

这不是假设性的安全增强——这是令牌化与加密之间最根本的区别。加密让数据变得"不可读"，令牌化则让数据"不存在"。

从密码学视角看两者的本质差异

要理解令牌化为何能与加密产生如此不同的安全效果，需要从数学层面审视它们的工作原理。

**加密（Encryption）**是将明文数据通过加密算法和密钥转换为密文的过程。以AES-256为例，加密后的密文与原始明文之间存在确定性的数学关系——只要拥有正确的密钥，任何人都可以将密文还原为明文。这种"可逆性"是加密设计的核心特性，但也意味着：密文本身仍然承载着原始信息的全部价值，只是暂时被"锁定"。

2014年发表在IACR（国际密码学研究协会）的论文《A Cryptographic Study of Tokenization Systems》首次从形式化角度定义了令牌化的安全模型。研究者指出，令牌化系统需要满足三个层次的安全定义：

IND-TKR：仅知道令牌本身时，无法在计算上还原PAN
IND-TKR-CV：即使获得令牌库（Token Vault）内容，仍无法建立令牌与PAN的关联
IND-TKR-KEY：即使密钥泄露，令牌与PAN仍保持不可关联

论文的数学证明表明，正确设计的令牌化系统可以满足IND-TKR-KEY这一最强的安全定义——这意味着，即使攻击者获取了系统的全部加密密钥，令牌本身仍然无法被还原为原始PAN。这在加密模型中是不可能实现的。

**令牌化（Tokenization）**则完全不同。它不是一种数学变换，而是一种"引用替换"：系统生成一个与原始数据毫无数学关系的随机值作为令牌，然后在高度安全的令牌库中存储令牌与原始数据的映射关系。令牌本身不包含任何关于原始数据的信息——它只是一个"指针"。

sequenceDiagram
    participant Merchant as 商户系统
    participant TSP as 令牌服务提供商
    participant Vault as 令牌库
    participant Issuer as 发卡行

    Note over Merchant,Issuer: 令牌化流程
    Merchant->>TSP: 发送PAN请求令牌
    TSP->>TSP: 生成随机令牌
    TSP->>Vault: 存储 PAN↔Token 映射
    TSP-->>Merchant: 返回令牌（无PAN）
    
    Note over Merchant,Issuer: 支付流程
    Merchant->>TSP: 发送令牌请求授权
    TSP->>Vault: 查询令牌对应PAN
    Vault-->>TSP: 返回PAN
    TSP->>Issuer: 发送PAN请求授权
    Issuer-->>TSP: 返回授权结果
    TSP-->>Merchant: 返回授权结果

这种架构差异带来了一个关键的安全优势：在商户环境中，PAN根本不存在。商户的系统只处理令牌，而令牌即使被完全泄露，也对攻击者毫无价值——因为他们无法访问令牌库来完成逆向映射。

PCI DSS合规的范式转变

PCI DSS（Payment Card Industry Data Security Standard）是支付卡行业的数据安全标准，由Visa、MasterCard、American Express、Discover和JCB共同成立的PCI安全标准委员会维护。其核心目标是保护持卡人数据环境（Cardholder Data Environment，CDE）。

2011年，PCI SSC发布了《PCI DSS Tokenization Guidelines》信息补充文档，首次明确阐述了令牌化对PCI合规的影响。文档指出：

“令牌化解决方案并不消除维护和验证PCI DSS合规的需要，但它们可能通过减少PCI DSS要求适用的系统组件数量来简化商户的验证工作。”

这句话的关键在于"减少适用范围"（Scope Reduction）。根据PCI DSS的要求，所有存储、处理或传输持卡人数据的系统组件都在合规范围内。传统加密方案下，虽然数据被加密，但这些系统仍然"处理"持卡人数据——密文本质上仍是持卡人数据的另一种形式。

但令牌化创造了一个全新的可能性：如果令牌无法被还原为PAN，且满足特定条件，那么存储和处理这些令牌的系统可能被认定不在PCI DSS范围内。PCI SSC指南明确规定了这一条件：

“要知道，PAN不能仅通过令牌及该令牌所在的系统被计算可行地恢复。”

这是一个革命性的概念。它意味着，正确实施的令牌化方案可以将大量系统从PCI审计范围中移除，显著降低合规成本和复杂度。

合规范围缩减的具体机制

PCI DSS指南详细说明了令牌化系统如何实现范围缩减：

系统特征	在PCI范围内	可能不在PCI范围内
存储、处理或传输PAN	✓	-
存储、处理或传输加密PAN	✓	-
存储、处理或传输可逆令牌	✓	-
存储、处理或传输不可逆令牌	-	✓（需满足隔离要求）
可访问令牌库或解密密钥	✓	-

关键在于"不可逆"的定义。PCI指南区分了几种令牌生成方法：

数学可逆加密函数：使用已知强加密算法和密钥生成令牌——本质上仍是加密
单向不可逆加密函数：如带秘密盐值的哈希函数
索引/随机分配：令牌与PAN之间无数学关系，仅通过令牌库映射

只有第三种方法才能真正实现"不可逆"。PCI指南警告：

“如果令牌生成基于可逆加密方法（令牌通过加密算法和密钥从原始PAN数学推导得出），则生成的令牌是加密的PAN，可能需要额外的PCI DSS考虑。”

EMVCo支付令牌化规范：全球标准的技术框架

2014年3月，EMVCo发布了《EMV Payment Tokenisation Specification – Technical Framework》第一版，为全球支付令牌化确立了统一的技术标准。EMVCo由American Express、Discover、JCB、MasterCard、UnionPay和Visa共同成立，是EMV芯片支付技术的标准制定机构。

EMVCo规范定义了支付令牌化生态系统的核心角色：

令牌服务提供商（Token Service Provider，TSP）：负责令牌生成、存储、映射和生命周期管理的实体。TSP通常是支付网络或发卡行，它们维护令牌库并处理令牌到PAN的转换。

令牌请求方（Token Requestor）：向TSP请求令牌的实体。在移动支付场景中，数字钱包提供商（如Apple Pay、Google Pay）就是令牌请求方。

令牌用户（Token User）：使用令牌发起支付的商户或服务提供商。

令牌域限制控制

EMVCo规范引入了"令牌域"（Token Domain）的概念，这是令牌化的一个关键安全特性。令牌可以被限制在特定的使用场景中：

特定商户：令牌只能在该商户的交易中使用
特定设备：令牌只能在特定设备上使用（如Apple Pay中的Device Account Number）
特定交易类型：令牌只能用于特定类型的交易（如电子商务或NFC支付）

这种限制通过令牌域限制控制（Token Domain Restriction Controls）实现。当令牌在授权请求中被提交时，支付网络会验证令牌的使用是否在其被授权的域内。如果令牌在域外使用，交易将被拒绝。

这意味着，即使攻击者窃取了令牌，他们也无法在其他地方使用它——令牌本身就是"受限"的。

安全元素与移动支付的安全架构

Apple Pay的NFC支付是EMVCo令牌化规范的典型实现案例。根据Apple的安全架构文档，其支付系统包含以下关键组件：

安全元素（Secure Element）：一个通过EMVCo和Common Criteria认证的Java Card平台集成电路。它存储令牌相关的凭证数据，并与NFC控制器直接通信，确保交易细节不会暴露给设备的主处理器。

安全隔区（Secure Enclave）：管理用户认证（Face ID、Touch ID或密码）和安全意图处理。它通过共享密钥与安全元素通信，提供通信链路的机密性和完整性保护。

NFC控制器：处理NFC协议，并在应用处理器和安全元素之间、以及安全元素和POS终端之间路由通信。

当用户使用Apple Pay进行非接触式支付时，交易流程如下：

用户通过Face ID/Touch ID/密码授权交易
安全隔区向安全元素发送认证数据
安全元素验证认证，激活NFC接口
安全元素直接与POS终端通信，生成交易专用密码（Cryptogram）
令牌和密码被发送到支付网络进行授权
支付网络将令牌映射回PAN，验证密码，完成授权

整个过程中，PAN从未出现在商户环境或设备主处理器中。

格式保留加密的局限性与令牌化的替代方案

在令牌化普及之前，支付行业广泛使用格式保留加密（Format-Preserving Encryption，FPE）来"保护"信用卡号。FPE是一种特殊的加密方法，其输出保持与输入相同的格式——例如，16位信用卡号加密后仍是16位数字。

然而，2014年的密码学研究论文指出了FPE的严重安全局限。由于信用卡号空间非常小（约10^16种可能），FPE的安全边界在实践中可能变得无效：

“对于基于Feistel网络的方案，当查询次数超过2^(#T/4)时，安全声明变得空洞；而某些方案在查询次数达到2^(#T-e)时才能保持有意义的边界。”

考虑到信用卡号空间#T约为2^53，这意味着FPE方案在面对大量查询攻击时可能被攻破。更根本的问题在于，FPE本质上仍是加密——密文与明文之间存在数学关系。

论文提出了两种不依赖FPE的令牌化构造方案：

TKR2构造：使用真随机数生成器或伪随机函数生成令牌，通过令牌库存储PAN与令牌的映射。令牌与PAN之间不存在数学关系。

TKR2a构造：在TKR2基础上，对令牌库中存储的PAN进行确定性CPA安全加密，即使令牌库被泄露，攻击者仍无法获取PAN。

实验数据显示，TKR2方案生成单个令牌的平均时间约为0.19毫秒（包括数据库插入），TKR2a约为0.26毫秒。这证明，不使用FPE的令牌化方案在实践中完全可行。

网络令牌化：支付网络驱动的下一代方案

传统令牌化由第三方支付服务提供商（Payment Service Provider，PSP）实施，令牌仅在特定PSP的系统中有效。这带来了"孤岛"问题——商户如果更换PSP，所有令牌都需要重新生成。

网络令牌化（Network Tokenization）由支付网络（如Visa、MasterCard）直接实施，令牌在整个支付生态系统中有效。Visa的数据显示：

令牌化交易相比PAN交易，欺诈率降低30%
授权率提升4.6%（全球CNP交易）
网络令牌可自动更新——当卡过期或被替换时，令牌自动更新，无需商户干预

网络令牌还引入了密码（Cryptogram）机制——每次交易生成一次性随机值，作为额外的认证因素。这为CNP（Card-Not-Present）交易提供了接近EMV芯片交易的安全级别。

网络令牌与PSP令牌的对比

特性	PSP令牌	网络令牌
发行方	支付服务提供商	支付网络（Visa/MasterCard等）
有效范围	仅在特定PSP系统内	跨PSP、跨商户有效
自动更新	需手动处理	自动更新
密码支持	通常不支持	每笔交易生成唯一密码
授权率提升	无直接提升	平均提升4-6%

令牌化的权衡与局限

令牌化并非万能药，它带来了自己的权衡：

架构复杂度：引入令牌库和TSP增加了系统架构的复杂性。商户需要与令牌服务提供商建立集成，处理令牌的获取、使用和生命周期管理。

性能开销：每笔交易都需要与令牌库交互（或通过支付网络完成映射），这增加了延迟。虽然优化后的系统可以将延迟控制在毫秒级，但对于高频交易场景仍是需要考虑的因素。

单点风险：令牌库成为安全的关键点。如果令牌库被攻破，整个令牌化系统的安全优势将荡然无存。因此，令牌库需要最高级别的安全保护——包括硬件安全模块（HSM）、严格的访问控制、全面的审计和监控。

高价值令牌风险：PCI指南特别警告了"可作为支付工具的令牌"：

“可以作为支付工具使用的令牌（有时称为’高价值令牌’）可能被’货币化’或用于生成欺诈交易，因此对攻击者的价值可能与它们要替换的数据相同。”

这意味着，如果令牌可以直接用于发起交易，那么它本质上就等同于PAN——即使它不能被还原为原始PAN。EMVCo规范通过令牌域限制控制和密码机制来缓解这一风险。

从"保护数据"到"移除数据"的范式转变

令牌化代表了一种安全哲学的根本转变：从"保护数据不被读取"转变为"让数据根本不存在于危险区域"。

传统安全模型假设攻击者会尝试攻破边界防御、窃取数据。加密方案下，即使数据被窃取，它仍然"有用"——攻击者可以尝试破解加密，或直接使用加密数据（如果密钥管理不当）。

令牌化创造了一种新的安全边界：在商户环境中，PAN根本不存在。攻击者可以攻破商户的每一个系统、获取每一个数据库，但他们得到的只是一堆无意义的字符串——没有密钥可破解，没有数学关系可利用，没有价值可变现。

这就是为什么令牌化能在加密无法企及的地方提供安全保障。它不是让数据"不可读"，而是让数据"不存在"。在安全工程中，这是质的差异。

参考文献

Díaz-Santiago, S., Rodríguez-Henríquez, L. M., & Chakraborty, D. (2014). A Cryptographic Study of Tokenization Systems. IACR Cryptology ePrint Archive, 2014/602.
PCI Security Standards Council. (2011). PCI DSS Tokenization Guidelines: Information Supplement.
EMVCo. (2023). EMV Payment Tokenisation Specification – Technical Framework, Version 2.3.
EMVCo. (2023). EMV Payment Tokenisation – A Guide to Use Cases, Version 2.2.1.
Apple Inc. (2024). NFC & SE Platform Security. Apple Support Documentation.
U.S. Senate Committee on Commerce, Science, and Transportation. (2014). A “Kill Chain” Analysis of the 2013 Target Data Breach.
Fortune Business Insights. (2025). Tokenization Market Size, Share, Forecast | Global Report [2034].
Visa Inc. (2024). A Deep Dive into Tokenized Transactions. Visa Commercial Solutions Knowledge Hub.

从密码学视角看两者的本质差异#

PCI DSS合规的范式转变#

合规范围缩减的具体机制#

EMVCo支付令牌化规范：全球标准的技术框架#

令牌域限制控制#

安全元素与移动支付的安全架构#

格式保留加密的局限性与令牌化的替代方案#

网络令牌化：支付网络驱动的下一代方案#

网络令牌与PSP令牌的对比#

令牌化的权衡与局限#

从"保护数据"到"移除数据"的范式转变#

参考文献#

更多精彩内容

密码强度校验规则的二十年误区——从NIST组合规则到熵值计算的完整解析

密码存储为何从MD5走向Argon2——一场持续六十年的攻防博弈

Token ID：大模型如何用一个数字代表一个词

为什么大模型连两位数加法都算不准：从tokenization到启发式神经元的完整技术解析

大模型的Padding陷阱：为什么Decoder推理必须左填充，而BERT却用右填充？