一个协议如何统一所有编辑器的智能——语言服务器协议的十年技术演进

2015年，如果你想在编辑器里获得代码补全、跳转定义、重构等「智能」功能，每个编辑器都需要单独实现一套语言支持。Emacs 有它的插件，Vim 有它的脚本，VS Code 有它的扩展——同样的功能要写 M × N 次。十年后，这种混乱被一个协议彻底终结。

从重复造轮子到统一协议

在 LSP 出现之前，编辑器生态面临一个经典的「M × N 问题」：M 种语言、N 种编辑器，理论上需要 M × N 种实现。如果你想给 Python 加一个跳转定义功能，你得为 VS Code 写一遍、为 Vim 写一遍、为 Emacs 再写一遍……每个编辑器的 API 都不一样，每个实现都包含重复的解析、索引、符号表构建逻辑。

这个问题的根源在于架构设计的错位。语言分析是语言相关的，但编辑器集成是编辑器相关的。传统方案把两者耦合在一起，导致了指数级的实现成本。

graph LR
    subgraph "传统架构 (M×N)"
        L1[语言 A] --> E1[编辑器 1]
        L1 --> E2[编辑器 2]
        L2[语言 B] --> E1
        L2 --> E2
    end
    
    subgraph "LSP 架构 (M+N)"
        LS1[语言服务器 A] --> P[LSP 协议]
        LS2[语言服务器 B] --> P
        P --> C1[编辑器 1]
        P --> C2[编辑器 2]
    end

OmniSharp 项目最早尝试解决这个问题。它为 C# 提供了一个独立的服务进程，通过 HTTP 协议与编辑器通信。微软的 TypeScript 团队也走了类似的路：TypeScript 语言服务器通过 stdin/stdout 与编辑器交互，使用 JSON 格式的消息。但这两个方案互不兼容——一个用 HTTP，一个用自定义协议。

VS Code 团队在同时集成这两个语言服务器时，意识到了标准化的必要性。他们以 TypeScript 服务器的协议为基础，将其泛化为一个语言无关的协议。JSON-RPC 被选为底层通信协议，因为它足够简单，而且各语言都有成熟的实现库。

关键的设计决策是引入「能力」（Capabilities）机制。不是每个语言服务器都支持所有功能——有些可能只提供诊断，有些可能支持完整的代码补全和重构。能力机制让服务器告诉客户端它能做什么，让客户端告诉服务器它能处理什么。这种协商机制使得协议可以渐进式扩展，同时保持向后兼容。

协议的骨架：JSON-RPC 与消息模型

LSP 建立在 JSON-RPC 2.0 之上。这是一个极其简单的 RPC 协议：请求包含一个方法名和参数，响应包含结果或错误。这种简单性是刻意为之的——它降低了实现门槛，让任何语言都能快速写出兼容的服务器或客户端。

graph TB
    subgraph "JSON-RPC 消息类型"
        R[Request<br/>请求] --> |需要响应| RR[Response<br/>响应]
        N[Notification<br/>通知] --> |无需响应| X[无响应]
        RR --> |成功| S[Result 结果]
        RR --> |失败| E[Error 错误]
    end

LSP 定义了三种消息类型：

**请求（Request）**需要响应。比如 textDocument/definition 请求跳转到定义位置，服务器必须返回定义所在的 URI 和位置范围。

**通知（Notification）**不需要响应。比如 textDocument/didOpen 通知服务器一个文档被打开了，服务器不需要回复任何内容。

**响应（Response）**包含请求的结果或错误信息。

所有消息都使用 UTF-8 编码的 JSON 文本。通信通常通过进程的 stdin/stdout 进行，但协议本身不限制传输方式——TCP、WebSocket、甚至共享内存都可以。这种灵活性让 LSP 能适应各种部署场景。

以「跳转到定义」为例，客户端发送的请求是这样的：

{
    "jsonrpc": "2.0",
    "id": 1,
    "method": "textDocument/definition",
    "params": {
        "textDocument": { "uri": "file:///path/to/file.rs" },
        "position": { "line": 10, "character": 5 }
    }
}

服务器的响应：

{
    "jsonrpc": "2.0",
    "id": 1,
    "result": {
        "uri": "file:///path/to/definition.rs",
        "range": {
            "start": { "line": 42, "character": 0 },
            "end": { "line": 42, "character": 15 }
        }
    }
}

这个交互模式非常直观：客户端用 URI 标识文档，用行号和列号定位光标位置。服务器返回定义所在的文档和位置范围。这些数据结构是语言无关的——它们不涉及抽象语法树、类型系统或编译器符号，只是简单的文本坐标。

这种简单性是 LSP 成功的关键因素之一。标准化一个 AST 比标准化一个位置坐标要难得多。不同语言的 AST 结构千差万别，但「第 10 行第 5 列」在任何语言里含义都一样。

文档同步：客户端与服务器的一致性博弈

编辑器里打开的文件内容存在于内存中，而语言服务器是一个独立进程。两者如何保持内容同步？这是 LSP 要解决的核心问题之一。

sequenceDiagram
    participant Client as 编辑器客户端
    participant Server as 语言服务器
    
    Client->>Server: initialize
    Server-->>Client: InitializeResult + capabilities
    
    Client->>Server: initialized
    Note over Client,Server: 初始化完成
    
    Client->>Server: textDocument/didOpen
    Note over Client,Server: 发送完整文档内容
    
    loop 每次编辑
        Client->>Server: textDocument/didChange
        Note over Client,Server: 增量或全量同步
    end
    
    Client->>Server: textDocument/didClose
    Note over Client,Server: 文档关闭

最简单的方案是「全量同步」：每次文档变化，客户端把整个文档内容发送给服务器。这实现简单，但在大文件上效率低下——改一个字符要传输几兆字节的数据。

LSP 支持更高效的「增量同步」。客户端只发送变化的部分：从第几行第几列开始删除了几个字符，插入了什么新内容。这听起来很完美，但实现起来有很多细节问题。

增量同步需要客户端和服务器对「位置」有一致的理解。问题在于，LSP 规定位置用 UTF-16 代码单元来计量。为什么是 UTF-16 而不是 UTF-8 或代码点？

这个选择是历史的妥协。VS Code 基于 Electron 构建，它的 JavaScript 引擎内部使用 UTF-16 表示字符串。微软的 Windows API 也使用 UTF-16。选择 UTF-16 让 VS Code 的实现最简单。

但这给其他编辑器带来了麻烦。大多数现代编辑器使用 UTF-8 或代码点来索引文本。当文件包含 emoji 或其他多字节 Unicode 字符时，UTF-16 代码单元和代码点不再一一对应。一个 emoji 在 UTF-16 中可能占用两个代码单元，这意味着客户端需要额外的转换逻辑。

一个著名的问题是「emoji 底部」导致 rust-analyzer 崩溃。当 Rust 代码中包含某些 emoji 时，错误的字符计数会导致服务器计算出错误的编辑位置，最终导致崩溃。这不是 rust-analyzer 的 bug——它完全按照 LSP 规范实现了 UTF-16 位置计算。问题出在规范本身的设计决策上。

直到 LSP 3.17，协议才增加了对 UTF-8 和 UTF-32 位置编码的支持。服务器可以在初始化时声明支持的编码，客户端可以从中选择。这是一个迟来的修复，但现有的服务器和客户端生态需要很长时间才能迁移。

能力协商：让协议可扩展

LSP 定义了几十种功能，但没有任何服务器或客户端能全部支持。能力协商机制让双方在初始化时交换各自支持的功能列表。

服务器能力包括：

textDocumentSync：文档同步方式
completionProvider：代码补全支持，包括触发字符和是否支持补全项解析
hoverProvider：悬停提示支持
definitionProvider：跳转定义支持
referencesProvider：查找引用支持
documentSymbolProvider：文档符号列表支持
workspaceSymbolProvider：工作区符号搜索支持
codeActionProvider：代码操作支持
renameProvider：重命名重构支持
以及更多……

客户端能力同样丰富：

textDocument 下的各种能力声明客户端对特定功能的支持程度
workspace 能力声明客户端对工作区级别功能的支持
window 能力声明客户端对 UI 交互的支持

这种设计的一个微妙之处在于能力的「动态性」。服务器的能力在初始化响应中声明，但协议允许运行时能力变化。配置改变可能导致服务器启用或禁用某些功能。这给客户端实现带来了复杂性——它需要监听能力变化通知并重新查询服务器能力。

从语法高亮到语义高亮

传统编辑器的语法高亮基于正则表达式匹配。编辑器扫描文本，根据正则规则给不同部分着色。这种方法简单快速，但有严重的局限性：它不知道代码的语义。

一个变量名、一个函数调用、一个类型——在正则眼里都只是「标识符」。当你在 IDE 里看到所有同名变量都用同一种颜色高亮时，那不是语法高亮，而是语义高亮。传统实现需要编辑器深度集成语言引擎，这又回到了 M × N 问题。

LSP 3.16 引入了语义标记（Semantic Tokens）协议。语言服务器可以告诉编辑器每个 token 的语义类型和修饰符。类型包括 class、function、variable、namespace 等；修饰符包括 declaration、definition、readonly、static、deprecated 等。

语义标记的传输格式经过精心设计以优化带宽。每个 token 不存储绝对位置，而是存储相对于前一个 token 的位置增量。一个 token 用五个整数表示：行增量、列增量、长度、类型索引、修饰符位掩码。这种编码方式使得大型文件的语义信息传输开销可控。

sequenceDiagram
    participant Client as 编辑器客户端
    participant Server as 语言服务器
    
    Client->>Server: textDocument/didOpen
    Note over Client,Server: 文档打开，内容同步
    Server-->>Client: textDocument/semanticTokens/full
    Note over Client,Server: 返回完整语义标记
    Client->>Client: 应用语义高亮
    
    Client->>Server: textDocument/didChange
    Note over Client,Server: 文档变化
    Server-->>Client: textDocument/semanticTokens/full
    Note over Client,Server: 返回更新后的语义标记

语义高亮的实现有一个性能挑战：服务器需要在每次编辑后重新计算整个文件的语义标记。对于支持增量更新的服务器，可以只发送变化的 token，但这要求服务器追踪精确的变化范围，实现复杂度显著增加。

Inlay Hints：在代码中嵌入类型信息

现代静态类型语言的一个常见痛点是类型推断。编译器知道变量的类型，但读者看不出来。函数参数的名字在调用处不可见，只能靠记忆或跳转查看。

LSP 3.17 引入了 Inlay Hints 协议。服务器可以在代码行内插入虚拟文本，显示类型信息、参数名称等。这些文本不属于源代码，只在编辑器中显示。

// 源代码
let users = fetch_users();
let count = users.len();

// 带 Inlay Hints 的显示
let users: Vec<User> = fetch_users();
let count: usize = users.len();

Inlay Hints 的实现需要客户端和服务器紧密配合。服务器返回提示的位置、文本、种类（类型、参数等）和可选的点击操作。客户端负责在编辑器中渲染这些提示，并处理用户的交互（如点击跳转到定义）。

性能是关键考量。服务器不应该在每次按键后重新计算所有 Inlay Hints。协议支持按需请求：客户端只在视口可见范围内请求提示，用户滚动时再请求新范围。一些实现还引入了缓存和防抖机制，避免频繁的服务器请求。

rust-analyzer：增量计算的工程典范

rust-analyzer 是 Rust 的官方语言服务器，也是 LSP 生态系统中最先进的实现之一。它的架构设计解决了一个核心问题：如何在频繁编辑的场景下保持快速响应？

传统的语言服务器架构有两种极端。一种是「懒加载」：只在需要时解析文件。首次跳转定义可能需要几秒钟来解析整个项目。另一种是「全索引」：启动时构建完整的项目索引，可能需要几分钟。

rust-analyzer 选择了第三条路：增量计算。它的核心是 Salsa 框架，一个受数据库查询优化启发的增量计算引擎。

Salsa 的核心思想是「记忆化查询」。每个计算（如解析文件、计算类型）被建模为一个查询函数。查询的结果被缓存，输入变化时只有受影响的查询需要重新计算。

graph TD
    subgraph "Salsa 查询依赖图"
        A[文件内容] --> B[AST]
        B --> C[符号表]
        C --> D[类型信息]
        D --> E[补全项]
        
        A -.->|变化| B
        B -.->|重新计算| C
        C -.->|重新计算| D
    end

当用户编辑文件时，只有从该文件出发的查询链需要重新计算。如果编辑没有改变函数签名，类型检查的结果可以复用。这种细粒度的增量计算使得 rust-analyzer 能在毫秒级响应用户操作。

Salsa 的另一个关键设计是「输入-派生分离」。输入是系统外部的数据（如文件内容），派生是从输入计算出的数据（如 AST、类型）。派生值总是可以从输入重新计算，因此不需要持久化——它们可以被丢弃以节省内存，在需要时重新计算。

这种架构使得 rust-analyzer 在大型 Rust 项目（如 Rust 编译器本身）上仍然保持流畅。用户可能打开几百个文件，但只有可见文件的计算被优先处理。后台线程逐步索引整个项目，不会阻塞用户交互。

性能优化的另一条路：Deno LSP 的十倍提速

Deno 的语言服务器在 2024 年实现了十倍性能提升，它的优化策略代表了另一种思路。

Deno LSP 使用 Rust 编写服务器端，但类型检查委托给 TypeScript 编译器。问题是 Rust 服务器和 TypeScript 编译器之间的进程间通信成为了瓶颈。每次补全请求都要跨越进程边界，序列化和反序列化带来显著延迟。

Deno 团队的解决方案是在 Rust 侧增加一个缓存层。常见的 TypeScript 编译器查询结果被缓存，后续请求可以直接从缓存返回，避免跨进程调用。

这个优化的关键洞察是：很多 LSP 请求是重复或相似的。用户在同一个位置多次请求补全、悬停提示针对同一个符号多次触发。缓存这些结果可以显著减少昂贵的计算和通信。

但缓存带来了一致性问题。当文档变化时，如何知道哪些缓存条目失效？Deno 使用了一种保守的失效策略：文档变化时清除所有与该文档相关的缓存条目。这可能导致一些有效的缓存被清除，但简化了实现复杂度。

另一个优化是请求批处理。LSP 协议本身不支持批量请求，但客户端可以在本地合并多个请求。比如用户快速输入多个字符，客户端可以只在输入停止后发送一次 textDocument/didChange 通知，而不是每次按键都发送。这种防抖策略减少了通信频率，但对补全的实时性有一定影响。

多语言项目：一个编辑器，多个服务器

现代软件项目经常使用多种语言：TypeScript 前端、Python 后端、Rust 核心模块。LSP 的设计允许一个编辑器同时运行多个语言服务器。

每个语言服务器独立启动、独立通信、独立计算。编辑器负责将请求路由到正确的服务器：.ts 文件的请求发给 TypeScript 语言服务器，.py 文件的请求发给 Pyright。

graph LR
    subgraph "编辑器"
        E[编辑器核心]
    end
    
    subgraph "语言服务器"
        TS[TypeScript<br/>语言服务器]
        PY[Pyright<br/>Python语言服务器]
        RS[rust-analyzer]
    end
    
    E --> |.ts 文件| TS
    E --> |.py 文件| PY
    E --> |.rs 文件| RS

这种架构的问题是服务器之间无法共享信息。TypeScript 语言服务器不知道 Python 那边的类型定义，Python 语言服务器不知道 TypeScript 的接口。对于跨语言的代码智能（如 Python 调用 TypeScript 编译的模块），LSP 提供了有限的帮助。

一个更深层的问题是配置的复杂性。每个语言服务器有自己的配置文件和设置方式。用户需要在多个地方配置格式化风格、linting 规则、路径映射。这些配置可能冲突，可能重复，维护成本随着语言数量线性增长。

协议层面也有限制。LSP 的 workspace/configuration 请求允许服务器向客户端查询配置，但不同服务器的配置命名空间没有统一标准。TypeScript 语言服务器期望 typescript.* 前缀的配置，Python 语言服务器期望 python.* 前缀。客户端需要为每个服务器维护独立的配置映射。

编辑器生态：从 VS Code 到全平台

LSP 的成功在很大程度上归功于 VS Code 的推动。作为协议的创造者，VS Code 对 LSP 有一流的内置支持。编写一个 VS Code 语言扩展只需要使用官方的 vscode-languageclient 库，几行代码就能建立起与语言服务器的通信。

但 LSP 的影响远超 VS Code。Neovim 从 0.5 版本开始内置 LSP 客户端，使得配置语言支持变得简单：

-- Neovim LSP 配置示例
vim.lsp.config.pyright = {
    cmd = { 'pyright-langserver', '--stdio' },
    filetypes = { 'python' },
}
vim.lsp.enable('pyright')

Emacs 有两个主要的 LSP 客户端：lsp-mode 和 eglot。前者功能全面，支持几乎所有 LSP 特性；后者追求极简，只依赖 Emacs 内置功能。Emacs 29 将 eglot 纳入官方发行版，标志着 LSP 成为 Emacs 的标准配置。

Vim 的生态更为碎片化。原生 Vim 没有 LSP 支持，需要依赖插件如 coc.nvim 或 vim-lsp。这些插件的配置方式和功能覆盖度各不相同，给用户带来了选择困难。

Zed 编辑器代表了新一代的设计理念。它从零开始设计时就考虑了 LSP，将语言服务器集成作为核心功能而非插件。这种原生集成允许更深度的优化，比如使用共享内存进行通信，避免 JSON 序列化开销。

Web 编辑器也在拥抱 LSP。Monaco Editor（VS Code 的核心编辑器组件）可以通过 monaco-languageclient 连接到语言服务器。这让浏览器中的代码编辑器也能获得接近桌面 IDE 的体验。挑战在于网络延迟——传统的 LSP 假设客户端和服务器在同一台机器上，网络环境下的延迟会严重影响交互体验。

协议的局限与争议

LSP 不是完美的协议。社区对它的批评主要集中在几个方面。

UTF-16 位置编码 是最常被诟病的设计。它给非微软生态带来了不必要的复杂性，而且这种复杂性很难被隐藏——每个处理多字节字符的场景都需要显式处理。

协议膨胀 是另一个问题。LSP 3.17 规范已经非常庞大，涵盖了从基础的文本编辑到调试支持的各种功能。新功能不断被添加，但旧功能很少被废弃。这导致实现者面临两难：实现完整规范代价高昂，实现子集可能导致兼容性问题。

性能模型不明确。LSP 规范没有定义响应时间的期望。一个补全请求应该多快返回？100 毫秒？1 秒？服务器实现者没有参考标准，客户端实现者不知道应该设置多长的超时。这导致用户体验因服务器而异，而且难以跨服务器比较性能。

状态管理混乱。服务器需要维护文档内容、项目配置、工作区结构等状态。协议对这些状态的生命周期定义不够清晰。比如，当一个文件被重命名时，服务器应该如何更新内部的符号索引？规范没有给出具体指导，不同实现的差异导致了不一致的行为。

语义信息的缺失。LSP 的设计哲学是「传输文本坐标，而非语义结构」。这让协议保持简单，但也限制了它所能支持的功能。服务器知道一个符号的类型，但无法直接告诉客户端类型的具体结构。客户端只能通过跳转定义来查看类型定义，而不能就地展开。

从 LSP 到更广阔的生态

LSP 的成功催生了相关协议的发展。

Debug Adapter Protocol (DAP) 是 LSP 的兄弟协议，用于标准化调试器与编辑器的通信。同样的理念：一次实现调试器，可以在多个编辑器中使用。DAP 的设计借鉴了 LSP 的经验，包括能力协商、JSON-RPC 基础、以及消息类型的分类。

Language Server Index Format (LSIF) 解决了 LSP 在大规模代码仓库上的性能问题。LSIF 是一种静态索引格式，可以在 CI/CD 流程中预先生成。编辑器加载索引文件后，不需要实时运行语言服务器就能获得代码智能。这对 GitHub 等代码托管平台特别有用——可以在不启动语言服务器的情况下提供「跳转定义」功能。

Model Context Protocol (MCP) 是最新的发展，专门为 AI 编程助手设计。它扩展了 LSP 的概念，让 AI 模型能够获取代码仓库的上下文信息。MCP 服务器可以提供文件内容、符号定义、依赖关系等信息，帮助 AI 更准确地理解和生成代码。

graph TB
    subgraph "协议生态"
        LSP[LSP<br/>编辑器↔语言服务器]
        DAP[DAP<br/>编辑器↔调试器]
        LSIF[LSIF<br/>静态索引]
        MCP[MCP<br/>AI↔代码上下文]
    end
    
    LSP --- DAP
    LSP --- LSIF
    LSP --- MCP
    
    subgraph "应用场景"
        E1[代码补全/导航]
        E2[断点调试]
        E3[代码审查平台]
        E4[AI 辅助编程]
    end
    
    LSP --> E1
    DAP --> E2
    LSIF --> E3
    MCP --> E4

写一个语言服务器：从理论到实践

实现一个语言服务器需要哪些核心组件？

文本存储与同步。服务器需要维护打开文档的内容，处理增量更新。一个常见的优化是使用 rope 数据结构（一种用于高效编辑的字符串数据结构）而非简单的字符串，以支持大规模文件的快速编辑。

解析器。将文本转换为抽象语法树（AST）。解析器的选择至关重要：传统解析器每次都从头解析，增量解析器可以复用之前的解析结果。Tree-sitter 是流行的增量解析器选择，它被 Neovim 和 Emacs 广泛采用，也独立用于语法高亮。

符号索引。构建一个从符号名到定义位置的映射。这需要遍历整个项目的 AST，提取所有声明。索引的粒度决定了查找的效率：按文件索引意味着每次查找都要扫描相关文件，按符号名索引可以 O(1) 查找但占用更多内存。

类型检查（对于静态类型语言）。这是最复杂的部分。完整的类型检查器需要处理模块解析、泛型实例化、类型推断等。很多语言服务器选择复用编译器的类型检查逻辑，而不是重新实现。

补全引擎。根据当前上下文生成候选补全项。需要考虑作用域可见性、类型兼容性、命名风格等因素。高级补全还支持代码片段（snippet），包含占位符和模板逻辑。

诊断发布。检测并报告代码问题。可以是语法错误、类型错误、linting 警告等。诊断消息需要包含精确的位置信息、严重程度、以及可选的修复建议（Code Action）。

一个最小可行的语言服务器可能只支持文档同步和诊断发布。这已经比没有任何语言支持要好——用户能看到语法错误。逐步添加补全、跳转、重构等功能是更现实的开发路径。

graph LR
    subgraph "语言服务器组件栈"
        A[文本同步] --> B[解析器]
        B --> C[符号索引]
        C --> D[类型检查]
        D --> E[补全引擎]
        D --> F[诊断发布]
    end
    
    subgraph "复杂度"
        A -.- |低| G[实现成本]
        B -.- |中| G
        C -.- |中| G
        D -.- |高| G
        E -.- |高| G
        F -.- |中| G
    end

十年后的反思

LSP 已经存在了十年。它成功吗？

从采用度来看，答案是肯定的。几乎所有主流编辑器都支持 LSP，几乎所有主流语言都有至少一个 LSP 服务器实现。学术界的研究显示，LSP 将 M × N 的实现成本降低到了 M + N。

从开发者体验来看，答案也是肯定的。今天的开发者可以自由选择编辑器，而不用担心语言支持的问题。新语言的出现伴随着 LSP 服务器的发布，用户可以在第一天就获得基本的编辑器支持。

但 LSP 也留下了一些未解决的问题。跨语言支持仍然薄弱，大型仓库的性能仍然有挑战，语义信息的传递仍然受限。这些问题可能需要在协议层面进行根本性的改进，也可能需要全新的工具来解决。

协议的价值在于它创造了一个协作的基础。编辑器开发者、语言开发者、工具开发者可以在一个共同的接口上工作，各自独立演进。这种解耦带来的收益远超协议本身的缺陷。LSP 已经证明了这一点，而它的继承者们将继续证明下去。

参考文献

Microsoft. Language Server Protocol Specification 3.17. https://microsoft.github.io/language-server-protocol/specifications/lsp/3.17/specification/
Protocol History. Microsoft Language Server Protocol Wiki. https://github.com/microsoft/language-server-protocol/wiki/Protocol-History
Bruzzone, F., et al. (2025). Code Less to Code More: Streamlining Language Server Development. Science of Computer Programming.
Bork, D. (2023). Catchword: Language Server Protocol. EMISA Journal.
rust-analyzer Architecture. Ferrous Systems. https://ferrous-systems.com/blog/rust-analyzer-find-usages/
How We Made the Deno Language Server Ten Times Faster. Deno Blog, 2024. https://deno.com/blog/optimizing-our-lsp
Salsa: A Framework for Incremental Computation. https://salsa-rs.github.io/
Tree-sitter: An Incremental Parsing System. https://tree-sitter.github.io/
LSP: the good, the bad, and the ugly. Michael PJ Blog, 2024. https://www.michaelpj.com/blog/2024/09/03/lsp-good-bad-ugly.html
The bottom emoji breaks rust-analyzer. Faster Than Lime, 2023. https://fasterthanli.me/articles/the-bottom-emoji-breaks-rust-analyzer
Semantic Tokens in LSP. https://pygls.readthedocs.io/en/latest/protocol/howto/interpret-semantic-tokens.html
Debug Adapter Protocol. Microsoft. https://microsoft.github.io/debug-adapter-protocol/
Language Server Index Format. Microsoft. https://microsoft.github.io/language-server-protocol/overviews/lsif/
JSON-RPC 2.0 Specification. https://www.jsonrpc.org/specification
VS Code Language Server Extension Guide. https://code.visualstudio.com/api/language-extensions/language-server-extension-guide
Neovim LSP Documentation. https://neovim.io/doc/user/lsp/
Emacs LSP Mode. https://emacs-lsp.github.io/lsp-mode/
Eglot: The Emacs Client for LSP. https://www.gnu.org/software/emacs/manual/html_node/eglot/
langserver.org: A list of language servers. https://langserver.org/
LSPFUZZ: Hunting Bugs in Language Servers. ASE 2025.

从重复造轮子到统一协议#

协议的骨架：JSON-RPC 与消息模型#

文档同步：客户端与服务器的一致性博弈#

能力协商：让协议可扩展#

从语法高亮到语义高亮#

Inlay Hints：在代码中嵌入类型信息#

rust-analyzer：增量计算的工程典范#

性能优化的另一条路：Deno LSP 的十倍提速#

多语言项目：一个编辑器，多个服务器#

编辑器生态：从 VS Code 到全平台#

协议的局限与争议#

从 LSP 到更广阔的生态#

写一个语言服务器：从理论到实践#

十年后的反思#

参考文献#

更多精彩内容

为什么电池在冬天续航会大幅下降？从锂离子电池的电化学原理到热管理系统的技术真相

为什么一封钓鱼邮件能骗过所有安全检测：从SMTP设计缺陷到现代认证体系的四十年攻防博弈

从电容放电到纳秒级信号完整性：DDR内存的四十年技术演进

双重认证为何频频失守：从SIM劫持到FIDO2的多因素认证二十年攻防博弈

为什么手机充电速度总达不到标称值？从协议协商到电池保护的技术真相