本文来自微信公众号:量子学派(ID:quantumschool),作者:德不罗意,题图来自:《机械姬》

2022年,ChatGPT问世,一经出现便掀起滔天巨浪。


【资料图】

如果你跟ChatGPT聊过天,一定会震撼于它所涉猎极广:

既能创造诗歌,也能修改代码。

可以批改作业,还能撰写论文。

写文案易如反掌,给方案不在话下。

......

有人兴奋,有人恐慌。

有人说,它会带来一次新的“工业革命”。

有人说,它会引发21世纪的“新卢德运动”。

这其实不是AI第一次向人类展示它的力量,自动驾驶、MIT主导的人类写字系统、Siri智能语音助手、AlphaGo......

但这一次,ChatGPT确实惊吓到了人类。

我们能抵挡来势汹汹的AIGC狂潮吗?人类是不是真的会被ChatGPT取代?

要回答这些问题,让我们先回归数学。因为ChatGPT背后的核心本质,是“贝叶斯公式”。

一、什么是贝叶斯公式?

历史有许多天才,生前籍籍无名,死后众人崇拜。

18世纪数学家托马斯·贝叶斯也是其中一位。

“贝叶斯”定理源于解决“逆向概率”问题时写的论文。

在此之前,人们只会计算“正向概率”。

什么是“正向概率”呢:

假设袋子里面有P只红球,Q只白球,它们除了颜色之外,其它性状完全一样。你伸手进去摸一把,摸到红球的概率是多少是可以推算出来的。

但反过来是否也可以计算,我们可以将它视为“逆向概率”:

如果我们事先并不知道袋子里面红球和白球的比例,而是闭着眼睛摸出一些球,然后根据手中红球和白球的比例,对袋子里红球和白球的比例作出推测。

这个问题就是逆向概率问题。

通俗地讲,就像一个迷信星座的HR,如果碰到一个处女座应聘者,HR会推断那个人多半是一个追求完美的人。

这就是说,当你不能准确知悉某个事物本质时,你可以依靠经验去判断其本质属性。

这个研究看起来平淡无奇,名不见经传的贝叶斯也未引人注意。

他写的论文直到他死后的第二年,才由他的一位朋友在1763年发表。

明珠蒙尘,就像画界的梵高,画稿生前无人问津,死后价值连城。

为什么贝叶斯定理200多年来一直被雪藏,不受科学家待见?

因为它与当时的经典统计学相悖,甚至是“不科学”的。

经典统计学中,数字规律来源于随机取样再行计算。

贝叶斯方法则建立在主观判断基础上,你可以先估计一个值,然后根据客观事实不断修正。

从主观猜测出发,这显然不符合科学精神,所以贝叶斯定理为人诟病。

1774年,法国的大数学家拉普拉斯也看到贝叶斯定理的价值。

不过他知道人类的普遍毛病,总是用传统来反对新思想。他懒得与人争论,直接给出数学表达:

二、贝叶斯公式是怎么工作的?

贝叶斯定理简单优雅、深刻隽永。

贝叶斯定理并不好懂,每一个因子背后都藏着深意。

它到底是如何“为人民服务”的呢?

对于贝叶斯定理,参照上面的公式,首先要了解各个概率所对应的事件。

P(A"B)是在B发生的情况下A发生的概率;

P(A)是A发生的概率;

P(B|A)是在A发生的情况下B发生的概率;

P(B)是B发生的概率。

举个例子。

量子妹约定帅哥去爬梧桐山,希望玩到人约黄昏后占点便宜,然而天公不作美,一大早天空多云。

这可怎么办?60%的雨天的早上是多云的。帅哥说,不玩了吧。

量子妹当然不甘心,劝说帅哥:

1. 多云不见得会下雨,大约30%日子早上是多云的!

2. 深圳天气平均一个月才3天下雨,10%的概率而已。

帅哥并不是绣花枕头,非常科学地用“贝叶斯公式”计算:

用“雨”来代表今天下雨,“云”来代表早上多云。

当早上多云时,当天会下雨的可能性是P(雨"云)。

P(雨"云) = P(雨)·P(云|雨) /P(云)

P(雨) 是今天下雨的概率 = 10%

P(云|雨) 是在下雨天早上有云的概率 = 60%

P(云) 早上多云的概率 = 30%

那么,贝叶斯定理的答案就出来了

P(雨|云) =0.1×0.6/0.3=0.20

帅哥毫无表情地说:今天下雨的概率是20%,确实可以去爬山。

三、贝叶斯公式取得人类信任

今天的贝叶斯理论开始遍布一切。从物理学到癌症研究,从生态学到心理学。

贝叶斯定理几乎像“热力学第二定律”一样放之宇宙皆准了。

物理学家提出了量子机器的贝叶斯解释,以及贝叶斯捍卫了弦和多重宇宙理论。

哲学家主张作为一个整体的科学可以被视为一个贝叶斯过程。

在IT界,AI大脑的思考和决策过程,被更多工程师设计成一个贝叶斯程序。

但贝叶斯诞生以来命途多舛,长期以来因为表面的不科学,并没有得到主流学界认可。

其实在日常生活中,我们也常使用贝叶斯公式进行决策。比如我们到河边钓鱼,根本就看不清楚河里哪里有鱼或者没鱼,似乎只能随机选择,但实际上我们会根据贝叶斯方法,利用以往积累经验找一个回水湾区开始垂钓。

这就是我们根据先验知识进行主观判断,在钓过以后对这个地方有了更多了解,然后再进行选择。所以,在我们认识事物不全面的情况下,贝叶斯方法是一种非常理性且科学的方法。

贝叶斯公式得到主流科学界的认可,主要因为两件事:

《联邦党人文集》作者揭密:

1788年,《联邦党人文集》匿名出版,两位作者写作风格几乎一致。其中12篇文章作者存在争议,而要找出每一篇文章的作者极其困难。

两位统计学教授采用以贝叶斯公式为核心的分类算法,10多年的时间,他们推断出12篇文章的作者,而他们的研究方法也在统计学界引发轰动。

美国天蝎号核潜艇搜救:

1968年5月,美国海军天蝎号核潜艇在大西洋亚速海海域失踪。军方通过各种技术手段调查无果,最后不得不求助于数学家John Craven,John Craven提出的方案使用了贝叶斯公式,搜索某个区域后根据搜索结果修正概率图,再逐个排除小概率的搜索区域,几个月后,潜艇果然在爆炸点西南方的海底被找到了。

2014年初马航MH370航班失联后,科学家想到第一个方法就是利用贝叶斯定理开始区域搜索,这个时候,贝叶斯公式已经名满天下了。

四、贝叶斯公式展示“神迹”

当然,贝叶斯定理名扬天下,主要还是在人工智能领域的应用。特别是自然语音的技术识别,让人类见识了A.I.的“思考力”。

人类语言的多义性,可以说是信息里最复杂最动态的一部分。

机器怎么知道你在说什么?

当看到机器翻译的准确性,你也会感叹这简直就是“神迹”,它们比大部分现场翻译要强得多。

语音识别本质上是找到概率最大的文字序列。

一旦出现条件概率,贝叶斯定理总能挺身而出。

我们用P(f|e)区别于以上的P(A|B)来解释语音识别功能。

统计机器翻译的问题可以描述为:给定一个句子e,它可能的外文翻译f中哪个是最靠谱的。

即我们需要计算:P(f|e)。

P(f|e) ∝ P(f) * P(e|f)

这个式子的右端很容易解释:那些先验概率较高,并且更可能生成句子e的外文句子f将会胜出。我们只需简单统计就可以得出任意一个外文句子f的出现概率。

随着大量数据输入模型进行迭代,随着计算能力不断提高,随着大数据技术的发展,贝叶斯定理威力日益凸显,贝叶斯公式巨大的实用价值也愈发体现出来。

语音识别仅仅只是贝叶斯公式运用的其中一个例子。

实际上,贝叶斯思想已经渗透到了人工智能方方面面。

五、贝叶斯网络,AI智慧的拓展

语音识别,见证了贝叶斯定理的能力。

贝叶斯网络的拓展,则可以看到更强大的人工智能未来。

借助经典统计学,人类已经解决了一些相对简单的问题。

然而经典统计学方法却无法解释复杂参数所导致的现象,例如:

龙卷风的成因,2的50次方种可能的最小参数值比对;

星系起源,2的350次方种可能的星云数据处理;

大脑运作机制,2的1000次方种可能的意识量子流;

癌症致病基因,2的20000次方种可能的基因图谱;

……

面对这样数量级的运算,经典统计学显得力不从心。

科学家别无选择,最终寻找贝叶斯定理给予帮助。

把某种现象的相关参数连接起来,再把数据代入贝叶斯公式得到概率值,公式结网形成一个成因网,即贝叶斯网络,如下图所示:

这也是贝叶斯网络被称为概率网络、因果网络的原因。

利用先验知识和样本数据,确立随机变量之间的关联,然后得出结论。

一个又一个的节点,一个又一个的概率,都来源于人类的先验知识,有效知识越多,贝叶斯网络展示的力量越让人震撼。

今天一场轰轰烈烈的“贝叶斯革命”正在AI界发生:

贝叶斯公式已经渗入到工程师的骨子里,贝叶斯分类算法也成为主流算法。

在很多工程师眼中,贝叶斯定理就是AI发展的基石。

结语

人工智能第一课,都是从贝叶斯定理开始。

大数据、人工智能和自然语言处理中都大量用到贝叶斯公式。

ChatGPT是如何确定生成的句子是合理的?

背后同样是贝叶斯公式在主导。

贝叶斯公式有多厉害?

ChatGPT已经向我们演示一遍了。

不过,贝叶斯公式与AI的结合,到底是一场科学的革命,还是一场理念的革命?到底是生产方式的革命,还是人类在革自己的命?

我们无法得知。

在与ChatGPT对话的过程中,偶尔发现部分回答有些诡异。

甚至开始担心,ChatGPT再这样下去,会不会诞生“自我意识”

到那时候,人类与AI会不会真正成为对立的双方?

这似乎有点杞人忧天了。

纵观整个社会,倒不用太担心AI像人一样思考,最应该担心人类已经失去了思考。

本文来自微信公众号:量子学派(ID:quantumschool),作者:德不罗意

推荐内容