为什么大模型记不住之前的对话——从无状态推理到长期记忆架构的技术突围

你有没有这样的经历:和一个AI助手聊了很久,详细告诉它你的饮食偏好、工作习惯、兴趣爱好,几周后再打开对话,它却像第一次认识你一样,问你是不是素食者——明明你上次已经说过不下三次。这不是AI"健忘",而是它从未真正"记住"过任何东西。 ...

12 min · 5655 words

RAG检索为何频频失准:从向量空间的数学局限到语义鸿沟的技术突围

一个法律科技团队花了六个月搭建的RAG系统,在内部测试中表现完美——准确率超过90%。但上线第一周,用户投诉就涌了进来:系统检索到的条款总是"差那么一点"。问的是"合同解除后赔偿如何计算",返回的却是"合同解除的条件有哪些";问的是"违约金上限",拿到的却是"定金与违约金的区别"。 ...

9 min · 4353 words

偏头痛为何被称为神经系统疾病而非血管疾病?从三叉神经血管系统到CGRP的四十年认知革命

一个光点出现在视野中央。起初只是一个小小的闪烁,但几分钟后,它开始扩大——不是简单地变大,而是延展成锯齿状的弧线,边缘闪烁着彩虹般的光芒,像一座不断扩张的城堡城墙。视野中央的区域逐渐被"吞噬",你无法看清那里的任何东西。二十分钟后,这个奇异的视觉现象消退了,取而代之的是太阳穴处开始跳动的剧痛——偏头痛来了。 ...

11 min · 5491 words

为什么人会脸盲?从梭状回面孔区到面孔识别神经通路的完整解密

在人群中认出一个熟悉的人,对大多数人来说是再普通不过的事情。然而,对有些人来说,这却是一项艰巨的挑战。他们可能在聚会上与朋友擦肩而过却不自知,甚至无法在照片中认出自己的家人。这不是记忆力的问题,也不是视力的缺陷——他们患有一种被称为"脸盲症"或"面孔失认症"(prosopagnosia)的神经认知障碍。 ...

10 min · 4753 words

为什么大模型能从几个例子中学会新任务:从隐式梯度下降到Induction Head的技术解密

2020年5月,OpenAI发布了GPT-3。论文中有一个让研究社区困惑不已的发现:这个拥有1750亿参数的模型,竟然能在没有任何参数更新的情况下,仅凭输入中提供的几个示例,就学会完成全新的任务。 ...

10 min · 4967 words

为什么快乐时光总是短暂?从多巴胺到纹状体的时间感知神经科学

一场期待已久的演唱会开始了。你沉浸其中,感觉才过了十几分钟,一看手机——两个小时已经过去。同样是两个小时,如果你在牙医的椅子上张着嘴等待,每一秒都像被无限拉长。古希腊哲学家奥古斯丁曾感叹:“时间究竟是什么?没人问我,我倒清楚;一旦问我,我想说明,便茫然不解了。“这个困惑持续了一千六百年,直到神经科学终于开始揭示时间感知背后的生物学真相。 ...

11 min · 5207 words

为什么鼻腔会轮流堵塞:从鼻周期到自主神经系统的隐形交响

此时此刻,你很可能主要通过一个鼻孔呼吸。试着用手指轮流堵住左右鼻孔,吸气比较一下——大多数时候会发现一侧明显更通畅。这不是感冒,也不是鼻炎,而是一个被忽视了一个多世纪的正常生理现象:鼻周期(Nasal Cycle)。 ...

8 min · 3529 words