山河蒙尘
当今科学界的三大问题
自然界中什么是自然的?自然界是否可能不自然?当今科学中的重大问题是否仅仅是知识的空白(或巨大鸿沟),使自然界显得神奇,还是它们暗示需要范式转变,需要一种新型的科学解释,不是基于系统(自然)法则而是系统学习?关于网络化描述性科学世界观(我们必须消除所有解释!)与学习性解释之间的区别,前者充满随机细节因而难以解释 - 而后者基于学习
作者:三与四的寓言
多重宇宙 - 华盛顿国家美术馆 (来源)
在未来一个世纪里,脑科学可能遇到的最糟糕情况是什么?发现大脑中没有"进化"。与生物学不同,生物学的所有重大成功都源于一个算法,这是任何科学领域中最简单、最成功、最全面的解释(比物理学还要多得多!),我们可能会发现大脑中没有任何全面或核心算法可以概括。大脑依赖于无数平衡,也许甚至是基因编程的,这些平衡很难重现、改进甚至理解。简而言之:发现大脑不仅复杂,而且错综复杂,甚至是一个无法解开的结。就像达尔文之前的生物学:看起来像是许多相关的情况,即一个网络 - 而不是一个算法。一个语言、分类和特征系统 - 而不是一个学习系统。

而脑科学的最大希望是什么?出现一位大脑领域的爱因斯坦,能解码基本的科学原理,很好地解释其运作方式。也就是说,大脑是由强大的算法驱动,而不仅仅是大数据和庞大的程序化操作系统。它不依赖于主板级别的精细调节。否则,即使我们成功创造超级智能,我们也很难为它创造所需的精确平衡,这些平衡是极其缓慢和漫长的进化的产物,从这里到灾难的道路很短。换句话说,如果我们发现除了旧的进化之外没有新的学习算法存在 - 那么我们的处境就很糟糕。谁能保证"深度学习"能够推动我们超越大脑学习系统最浅层的阶段?

这个精细调节与有效学习和适应算法之间的问题,可能是当今科学中最基本的问题,涉及所有精确科学领域,包括数学。问题在于丰富的复杂性是如何产生的?如果我们相信造物主或设计者的存在,就像中世纪那样,那么对我们世界的非常复杂和丰富的解释就不成问题。但是一旦我们进入现代科学领域,我们就很难接受宇宙在无数可能性中被精确设计得如此复杂,而且没有任何明显的原因。科学寻求的是非偶然发生的事件。因此,当今科学中最重要的三个问题实际上是同一个问题:


这三大异常暗示了宇宙中存在深层秩序,也许还有我们不理解的深层学习、适应和创造复杂性的算法。就像我们不理解进化 - 生物世界对我们来说看起来既随机又极其复杂,但也在其适应性上显得神奇,似乎是由设计者创造的 - 同样,我们可以希望发现其他学习算法将解决宇宙钟表的问题。是的,也许数学、脑科学和物理学都有自己的进化和学习机制。或者有一个深层的学习原因来创造复杂性 - 和它存在的条件。例如,我们也许能够将物理复杂性建立在数学复杂性之上,或者反之,至少创造一个问题的还原(在另一个物理宇宙中会有不同的数学吗?)。或者我们也许能够推广进化学习,它某种方式成功创造了允许其继续发展的条件(地球上曾经没有氧气大气层 - 生命创造了它!)。复杂性拼图中有某个我们不理解的重要组成部分,它不是"自然的"。任何以中彩票开始的答案都不是科学答案 - 而是神学答案。用设计者或模拟操作者来替换它要合理得多。

但如果我们确实达到这样的设计答案(这是可能的!任何设计都会留下痕迹)- 这将是一场真正的哲学革命,我们将理解我们不是偶然在这里。在当前的知识状态下,在不同的知识环境中,这些异常本应被视为强有力的证据,证明存在这样一个设计者上帝。只有我们相信将来会出现进化和"自然"解释,根据迄今为止科学史的发展,才阻止了这种显而易见的解释在今天也成立。但如果我们发现这些异常非常深刻,也许比我们想象的更广泛,而且在很长一段时间内都找不到自然解释 - 科学可能会以一种完全出乎意料的方式影响信仰,我们可能会回到中世纪的世界观。宇宙也许对我们来说看起来无比巨大,而不是某人实验台上的实验室实验,但相对于什么我们认定它是个大宇宙?我们有任何客观的衡量标准吗?宇宙中唯一客观巨大的东西是数量级的数量,但实际上只有几十个这样的数量级。也许在更大的宇宙中有数千个数量级?也许有无限的数量级?也许我们的整个宇宙在规模上是微不足道的系统?

我们的宇宙实际上并不像我们倾向于认为的那样包含大量物质。因为宇宙几乎是空的。宇宙中几乎一切都是空的。相对于恒星间空间,恒星在比例上是微小的,有很多个零,同样粒子相对于它们之间的距离也是微小的,以此类推。真正驱动宇宙的不是物质本身,而是填充这些空间的力、电荷和场,这些才是真正的宇宙。物质最终是一种幻觉。我们完全是空的,我的手指不能穿过键盘按键的唯一原因不是那里充满了物质,因为它实际上完全是空的 - 而是有排斥力在相对于我手指和希伯来字母键中电子大小的巨大距离上起作用,因此它们以与其大小不成比例的巨大力量相互排斥。如果没有这样的力,我会立即从椅子上掉下去穿过地球到达地核。而作为黑洞,即浓缩物质,地球实际上很小...也就是说 - 创造宇宙的人在其大小相对于塑形材料的数量上非常吝啬,但在小块塑形材料从远处相互影响的效果上非常慷慨。因此,当我们看到宇宙本身在物质量和空间之间存在如此极端的不匹配时,很难谈论相对于整个宇宙的大小:我们的整个宇宙相对于其他宇宙可能是微小的 - 或巨大的。一个小实验 - 或一个难以想象的庞然大物。

同样的问题不仅涉及空间,也涉及时间。如果空间和时间的客观尺度是宇宙本身,那么我们,无论是作为物种还是个体,在其中占据的时间量都比空间大得多。例如,作为进化,我们在这里超过宇宙寿命的三分之一,而作为一块物质,地球不到宇宙的纳米-纳米-什么,我们作为人类相对于宇宙大小的比例也是类似的。我们不仅仅类似于普鲁斯特《追忆逝水年华》结尾令人震撼段落中的那些时间巨人,我们实际上是时间面条。在空间上微小但相对于大小占据巨大时间的生物。但谁说甚至宇宙本身可以成为客观的衡量标准?宇宙能有任何客观的衡量标准吗?

宇宙中唯一客观的距离和数量就是数量级本身。正是它们决定宇宙实际上是空的,因为其部分的大小与它们的影响距离和空间之间有很多数量级。我们的真实宇宙边界,远超任何时空边界,是否实际上是我们可以接触到的数量级的边界?复杂性的答案是否不幸地恰恰在我们无法接触到的数量级中,无论是比我们大(大设计者?超级宇宙?其他结构?),还是小得多(某种在其上的所有数量级中创造复杂性的基础,也许甚至创造数学本身和自然法则)。但也许复杂性是一种幻觉?毕竟宇宙中有很多数量级没有复杂性,数学中也有很多简单、无趣的部分。也许复杂性恰恰是由存在大量数量级产生的,这些数量级允许逐步创造复杂性?

如果我们统一进化算法和神经网络算法,这是我们所知的两种自然学习算法,我们会发现创造复杂性的是一代接一代或一层接一层(深度学习),每一代和每一层都有大量冗余的代理(生物或神经元)。也就是说,有一种复杂性来自系统经历的时间分层,也有一种复杂性来自系统中的空间分层。分层是复杂性的父亲,因此也是发展和学习的父亲。难道不合理的是也会有来自系统中数量级分层的复杂性?也就是说,每个数量级都反映出从其下面产生的更大复杂性?宇宙学习机制难道不能是建立在数量级上的学习机制,概括了时间和空间中的学习机制?

数学复杂性也是由无数阶段一个接一个构建的,根据不断发展的定义和数学逻辑语言。我们是否应该将世界的复杂性理解为简单的计算,或者它来自比计算更基本的机制?为什么数学中如此遥远的分支之间存在如此令人惊讶和深刻的联系(这是现代数学所有部分中反复出现的中心故事)?是否可能所有数学不仅像具有深层联系的网络那样构建,而且在其基础上有一个基本现象,存在海洋?或者是否存在某种深层的生成过程在数学各处创造复杂性,例如素数的复杂性,我们可以深入理解它?数学是否有进化?数学逻辑确实是一个生成过程,但它不是"深层的",它不理解所创造的秩序,只是外部语言描述(事实上它相对独立于数学的其他部分,尽管有模型论,以及最近在类型论和范畴论之间联系的进展)。我们是否会在数学基础中发现学习?

这些问题处于我们认知的边缘。但也许如果我们统一我们所知的来自进化、大脑、数学和物理世界的不同学习算法,我们可能会达到某种统一的基本学习理论,理解我们世界中不同学习算法的共同深层基础,因此也理解学习的性质和限制。我们是否可能在21世纪发现物理学中的万物理论(TOE),统一20世纪两大物理理论 - 量子力学和相对论 - 的框架,实际上是基于进化学习的想法,就像生物学基于进化一样?这样的理论甚至可能比物理"万物理论"更普遍 - 因为我们可能发现它包括所有精确科学,包括数学、生物学、计算机科学和脑科学 - 在一个学习框架下。例如,不同的学习算法是一个基本算法的特殊情况。

如果我们选择一个更谦虚的目标,就像今天的网络理论开始为科学和技术各个领域的网络提供见解一样,未来我们可能会有一个跨学科和基础性的学习理论,甚至可能被发现比网络的概念更基本。就像学习对大脑来说比神经网络更基本,或者对进化来说比基因网络更基本一样。我们当然可以想象21世纪的某种学习爱因斯坦,将其确立为超级理论,并在其中发现各种定量预测(学习可以有多快?在什么阈值条件下?需要多少信息和产生多少信息?如何通过学习测量"丰富的复杂性"?等等)。

那时,这样的理论可能会找到宇宙中复杂性的一般和全面解释,以及驱动它的基本学习机制。然后我们将停止将宇宙理解为计算(缺乏深度和洞察),或网络(随机),或概率(不可能),开始将其视为学习。我们不知道还有什么自然过程能创造丰富的复杂性,无论是在文化中,在人类中,还是在进化中,不是学习。也许我们会发现这也适用于物理学和数学?也许这种算法的性质会告诉我们为什么我们是唯一收敛到智能状态的进化,可能存在太多类型的复杂性发展,发生在其他进化中,导向我们目前不理解的其他方向。毕竟,进化可能倾向于收敛到与我们不同的学习算法(例如,它是否自然地产生数字计算,比如从基因组,而不是大脑?为什么这不是更合理的?为什么要创造另一个模拟的学习机制,与已经存在和准备好的数字遗传学习机制分离?)。如果创造了一个普遍和全面的学习科学理论,我们甚至可能能够测量进化"可能"创造的复杂性,并理解我们是否真的是一个极端情况,或识别通往我们的道路上某个罕见的转折点,在之后相对容易地导致复杂性。也许,如果我们破译了自然的基本学习算法,我们也会理解人工智能应该如何自然地发展,以及什么是宇宙中最自然的智能学习算法。而自然的东西 - 可能更安全、更正确、更适合世界。适合自然。适合世界的自然。
文化与文学