为什么让大模型输出JSON格式这么难?从自回归生成到约束解码的技术突围

一个金融科技团队花了三个月开发智能客服系统,核心功能是将用户的自然语言查询转换成结构化的JSON格式,再传递给后端API处理。测试环境下一切正常,但上线第一天就收到大量报错——JSON解析失败。排查日志发现,模型输出的JSON有的缺少逗号,有的多了尾随逗号,有的字段名拼错了,还有的直接在JSON后面加了一段"解释说明"。 ...

15 min · 7134 words