第512章 智辅的计算(第2页)

 

可以说这个人经验丰富,能力强。

 

理论而言,世界上所有的一切,都可以使用文字语言描述清楚——除非词穷。

 

那么大语言模型,是如何认知和使用人类的语言?

 

阅读到了这里,李前有点儿吃力,他开启通天祗,请教一直静静等待的林朝初和张琳。

 

林朝初看了眼张琳,张琳道:

 

“大语言模型使用统计学,推算文字排列组合的概率。”

 

她接过李前手里的平板,放在茶几上进行演示。

 

点开浏览器,输入一串文字:

 

‘这颗星球上最厉害的人是谁?’

 

“当我点下回车,算法会将这行文字,以单独文字和符号为单位,转化为数列,我们称之为token,token之间以向量连接。”

 

向量在数学的高维中,可以用空间坐标系表示。

 

智能模型,输入、计算、输出的计算过程,分为许多个维度。

 

每一个维度就是一个向量空间。

 

模型能力,取决于向量空间和向量的数量。

 

以智辅为例,发展到今天,其拥有近十亿个庞大向量空间,无数的向量。

 

“向量空间中,每个字词都有相互距离。”

 

张琳进入讲解模式,紧张消解,更显专业,

 

“相似的词语,在向量空间中的距离相近,比如玩家李前、游戏、超级地震、蜃景、林宇等,人一旦接触到相关事物,就会进行联想。

 

比如有人提到今天的蜃景。

 

假如是国人,他大概首先想到4号蜃景,想到林宇,想到林宇的处境。

 

如果林宇的处境比较危险,就会想到超级地震,然后想到还有玩家李前,李前可以解决麻烦。”

 

客厅中,李前正襟危坐,微微蹙眉听讲解,若有所思。

 

林朝初面带微笑。

 

李前的反应在预料之外,张琳略略尴尬,继续说道:

 

“理论来讲,超级地震和林宇间的距离,肯定比你和超级地震之间的距离更近,因为在大众认知中,异常生物消失,而李前非常强大。

 

林宇却很弱,飞都不会飞,又处在充满未知风险的大海上,随时可能遇到危机,死亡风险大。”

 

“向量不止有距离,还有夹角。

 

角度表示向量的相似性,20个蜃景,都很相似,但已经消失的蜃景,比现存的蜃景之间夹角更大。