推荐系统如何从海量数据中读懂你的心思:从协同过滤到深度学习的三十年技术突围
2006年10月,Netflix做了一件在当时看起来疯狂的事:公开发布了1亿条匿名用户评分数据,悬赏100万美元征集能把推荐准确率提升10%的算法。这个看似简单的数字背后,是一场持续三年的算法马拉松,吸引了来自186个国家的超过4万支队伍参赛。最终获胜的方案融合了超过100个子模型,技术报告长达92页。 ...
2006年10月,Netflix做了一件在当时看起来疯狂的事:公开发布了1亿条匿名用户评分数据,悬赏100万美元征集能把推荐准确率提升10%的算法。这个看似简单的数字背后,是一场持续三年的算法马拉松,吸引了来自186个国家的超过4万支队伍参赛。最终获胜的方案融合了超过100个子模型,技术报告长达92页。 ...
title: “为什么大模型会一本正经地胡说八道?从概率生成到注意力机制的技术解剖” date: “2026-03-07T09:12:30+08:00” description: “深入解析大语言模型幻觉现象的技术本质,从Transformer架构限制、训练数据缺陷到softmax瓶颈,揭示为什么幻觉不是bug而是架构的必然产物,以及RAG、思维链等缓解方案的有效性边界。” draft: false categories: [“人工智能”, “机器学习”, “深度学习”] tags: [“大模型幻觉”, “Transformer”, “注意力机制”, “LLM”, “RAG”, “概率生成”, “AI可靠性”] 2023年5月,纽约律师Steven Schwartz在准备法庭辩护时,让ChatGPT查找类似案例。模型自信地提供了《Martinez v. United States》《Jones v. United States》等多个判例,包括完整的案号、判决日期和法官意见。Schwartz将这些"案例"写入了法庭文件。直到法官要求核实,人们才发现:这些案例全部不存在。模型不仅虚构了案件名称,还编造了引文格式、判决细节和法理分析——每一处都符合法律文书的规范,却全是子虚乌有。Schwartz后来在宣誓书中承认,他"误以为ChatGPT不可能编造虚假信息"。 ...
1978年5月3日,数字设备公司(DEC)的市场经理Gary Thuerk做了一件在当时看来平平无奇的事:他给ARPANET上的393个用户发了一封邮件,宣传公司的新产品演示会。邮件主题是"DIGITAL WILL BE GIVING A PRODUCT PRESENTATION OF THE NEWEST MEMBERS OF THE DECSYSTEM-20 FAMILY"。 ...