随笔选辑 - 世界观(上)
返回目录
世界观(上)
我以前好像说过这种话:每个人在与其他人交互的时候就如同一堆封装起来的接口,别人有什么需求就从里面调,但是看不见这个黑盒内部如何工作。不过我后来发现其实与人交流的过程中还是多少可以窥探到对方如何认识世界的一点线索,而且不同人认识世界的方式的差距比我想象得还要大。
先说明一下,这篇写得可能有点魔怔,因为一直在灌输,没有什么论证。希望以后我看到这篇文章的时候能觉得它很幼稚……
对我来说,这个世界最基本的道理是某种贝叶斯公式。
我们所做出的任何判断都基于自己的先验判断 $p(\cdot)$。人们会根据自己的知识和收集到的事实更新其先验,试图让它更接近世界真实的演化结果。如果用 $q(\cdot)$ 表示真实世界的分布——注意贝叶斯主义其实并不指定世界是确定的还是随机的,也就是说 $q(\cdot)$ 有可能是 one-hot 的也可能是个更复杂的分布——人们在做的就是尽可能减小 $p,q$ 间的距离。
以前的人们有一个美好的愿望:那就是完全解析这个 $q(\cdot)$,为此他们想象出了阿卡西记录,认为 $q(\cdot)$ 的规律是内蕴在宇宙本身中的。不过我更倾向于承认世界的无限性,将 $q(\cdot)$ 看成一个不可解的复杂系统,因为这样看来,人们为了改进 $p(\cdot)$ 所做的努力就更有意义了。
我们更新先验的方式就是贝叶斯推断,简单来说就是对已经发生过的事情进行不完全归纳。这套方法人人生而知之,但每个人不一样的地方就在于:
观察到的数据不同。熟悉贝叶斯推断的朋友都知道,只要先验不是太变态,在数据足够多的时候怎么设都大差不差,最后收敛到的是一样的东西。所以决定人们个性不一样的大概率不是先验不同,而是观察到的数据不同。
使用的模型不同。在抛硬币这种简单的问题上,大家比较容易达成一致:几乎所有人都相信抛硬币的结果是伯努利分布,而不是在相邻几次结果间存在 correlation。但是问题复杂起来后人们用的模型就不一样了。
比如我感觉做 LLM 的人多少有一种信念:语言分布很大程度上能建构世界模型。它和以前的 AI 不同的地方在于越来越多的人开始声称现在的 LLM 正在接近通用智能,这个描述有很多层含义:
第一,预测即智能;
第二,预测语言就能预测世界;
第三,自回归模型+神经网络可以预测语言。
对我来说,第一点感觉是对的,第三点感觉是错的,而第二点就是上面所说的这种信念。
这里的模型比较接近于我们平时说的“信仰”这个词。不管是宗教信仰,还是对物理规律的信仰,还是对数学命题的信仰,我认为都是解释世界的方式,也就是模型。人也会因为一些原因改变这种信仰,这可以称之为一次范式转换。
我自己身上就发生过一些局部的范式转换,以心理为例。最开始我只认一些很浅薄的数理知识,所以感觉生理主义非常有道理,支持把一切还原成生物学然后把生物学还原成物理学;后来我变成了神棍,所以感觉精神分析非常有道理,感觉本我、自我、超我全对;现在我有了一些 CS 背景,说出来的话就像上面这样带有很浓的认知主义色彩。