《复杂》这本书在半年前读过,感觉不错,但没有做整理。以下为简单整理:
本书是以侯世达的著作《哥德尔、埃舍尔、巴赫——GEB之大成》中对还原论的阐述作为前言开头的,而本书的作者Melanie Mitchell正是侯世达的学生。本书源自她在圣塔菲研究所做的关于复杂系统的演讲整理而成,面向非专业读者。就影响力和阅读感来讲我觉得还是挺震撼的。全书共分为五部分
①背景和历史
②计算机中的生命和进化
③大写的计算
④网络
⑤尾声
第一部分 背景和历史
一、复杂性是什么?
本章是以昆虫群落来开头,数百乃至上百万只蚂蚁在道路中行进。它们“寻找食物”、“互相交流”、“抵抗入侵者”......到底谁是它们的头目?(其实它们没有头目)单个蚂蚁的行为是如此简单,彼此交流的信息也很简单,但是它们一旦汇集了成千上万只后也就展示出了群体性的优势,甚至有了“集体的智慧”。生物进化又是如何产生出个体如此简单整体上却如此复杂的生物?
其实人的大脑和免疫系统也有着和蚁群类似的效应:神经元之间相互连接和触发,免疫细胞之间的参与和入侵者进行大PK,它们都没有一个整体的协调者,却能高效地配合,这些在作者看来都是去中心化的群体协同,也都是复杂系统研究的对象。
除去生物层面,人的社会层面也是一个群体性的复杂系统。比如每个人靠着简单的行事规则,简单的交流沟通就可以组织成一个庞大复杂的经济系统。很多人对此也是倍感兴趣,比如经济学家、商人、创业者等等。包括互联网的组成(有关网络但不仅限于互联网,在本书最后一部分有做部分介绍)比如以上,它们的共同点:
(1)它们有复杂的群体行为,但是没有中心的组织领导者
(2)它们的行为规则也很简单
(3)群体可以收发信号,个体也一样
(4)群体适应性强
复杂性科学兴起于上世纪80年代距今时间并不长。而本书讲的是科技前沿的概念但也讲述了科技前沿背后的核心概念的历史,接下来的四章即是贯穿全书的核心概念的历史和背景在这里稍作带过。
二、动力学、混沌和预测
经过亚里士多德与伽利略时代,有了实验观察作为基础。牛顿可以说凭借一己之力创建了动力学。随后即出现了“拉普拉斯妖”、“还原论”等等说法。但是随着“量子力学”、“三体问题”、和“混沌理论”的提出,给了精确预测致命打击(由于自己对以上几种说法有简单了解所以不再做较多说明)。书中列举了“线性兔子和非线性兔子”的例子来进一步阐述了这种对立关系。人们用logistic model来描述这种情形(计算机中的随机数生成往往就是运用logistic model)。而对logistic map的研究也从中发现了混沌系统的普遍特征:(1)看似混沌的行为有可能来自确定性系统而无需外部的随机源。(2)一些简单的确定性系统的长期变化由于对初始条件的敏感依赖性,即使在原则上也无法预测。(3)不能预测细节但是可以预测宏观层面上的变化。
三、信息
提到信息不能不提到热力学,通过热力学第一第二定律(非常有意思,又叫做“守恒定律”和“熵增定律“——时间之箭)于是麦克斯韦妖登场了,然而想要除此妖必用终极大法:将熵与信息联系起来(获取信息是要额外做功的)然而后人证明这种解释有误即又做出了修正。(小妖测量和进行判断时是需要额外做功的)对小妖难题的解决成为两个新领域的基础——信息论和信息物理学。
物理学中的四大力学有:牛顿力学、热力学、量子力学和统计力学。然而统计力学认为宏观尺度上的属性(例如热)是由微观属性(如无数的分子运动)产生的。统计出来的是一种概率和可能性。香农同时也把熵引入了信息当中。
四、计算
希尔伯特的二十三个问题可以说是鼎鼎大名。总的来说这些问题可以分成三个部分:“数学是不是完备的?数学是不是一致的?是不是所有命题都是数学可判定的?”“哥德尔干净利落地解决了第一和第二问题,接着第三问题又被图灵干掉了。”通过思考人类如何计算,他构造了一种假想的机器——图灵机。
希尔伯特的23个问题
五、六
接下来的第五章和第六章进化和遗传学概要,大部分只要拥有高中知识读起来感觉会很浅显易懂,就不在这里作介绍了。
七、度量复杂性
物理学家Seth Lloyd在2001年提出了度量一个事物或过程的复杂性的三个维度:(1)描述他有多困难。(2)产生他有多困难。(3)其组织程度如何。度量复杂性的方法书中给出了几种(1)用大小度量复杂性(2)用熵度量复杂性(3)用算法信息量度量复杂性(4)用逻辑深度度量复杂性(5)用热力学深度度量复杂性(6)用计算能力度量复杂性。(7)统计复杂性(8)用分形维度量复杂性(9)用层次性度量复杂性。
第二部分 计算机中的生命和进化
八、自我复制的计算机程序
本章从“生命是什么”谈起。从计算机中的自我复制到DNA的自我复制再到冯诺依曼的自复制自动机。
作者关于“生命是什么?”的问题,作为计算机科学教授试图将“自主”、“新陈代谢”、“自我复制”、“生存本能”,还有进化和适应这些过程机械化,并用计算机实现。这一部分即是讨论的这些。他们与达尔文主义的自我复制进化密切相关。在第四章介绍的哥德尔和图灵曾讨论过类似print()嵌套print()这种导致无穷反复的例子。冯诺依曼在生命最后的岁月里即给出了第一个能自我复制的机器的完整设计。
九、遗传算法(GA)
遗传算法实际上是模拟了人工育种的模式。书中用了一个“进化的罗比,易拉罐清扫机器人”的例子来进一步阐述GA的重要思想。
罗比的世界
第三部分 大写的计算
“计算机科学的真义是在自然界中无处不在的大写的计算”。
十、元胞自动机、生命和宇宙
计算在自然界中广泛存在例如前面提到的蚁群,如果更宽泛的定义计算概念,大脑也是计算机。鉴于人们通常会将问题尽可能简化,但仍然保留问题主要特征,许多人用元胞自动机这种理想化的复杂系统模型来研究自然界中的计算。
关于元胞自动机,感觉至少是学计算机的人都有所了解。开始冯诺依曼提出的元胞自动机稍复杂,后来康威发现了一种简单得多的两状态通用图灵机,也能进行通用计算,称为“生命游戏”。关于“生命游戏”,用黑格子表示开(活),用白格子表示关(死)。规则很简单,只有四条:(1)出生,死元胞的相邻元胞中如果刚好有3个是活的,下一步就变成活的;(2)存活,活元胞的相邻元胞有2—3个是活的,下一步就能继续存活;(3)过于稀疏,活元胞的相邻活元胞如果少于2个就会死去;(4)过度拥挤,活元胞的相邻活元胞如果多于3个就会死去。“生命游戏”启动后会自动的运行下去。(例如:如果只有开始只有个元胞,它会死;如果有四个元胞组成一个方格子则很稳定。如果三个元胞一排,下一次会变成一竖,后又是一排往复循环......)这里给出一个网上的模拟器链接生命游戏比较有意思。我们能够看到初始值对执行结果的影响是很大的,这也是“混沌”的一个特点。“没有人用生命游戏(或其他“通用”元胞自动机)来进行真实计算或是模拟自然系统。我们只是想利用元胞自动机的并行特征以及它产生复杂图形的能力。”基于“万物皆计算”的思想,为此沃尔夫勒姆写了一本书《一种新科学》。
十一、粒子计算
本书作者与赫拉贝尔结合“遗传算法”设计出了一种能改变元胞自动机规则的算法,用来计算多数分类问题。元胞自动机与我们的计算机有着本质的不同,但是作者发现与自然界中的基本粒子似乎有着相似性质。举个例子:“植物的气孔网络。所有有叶植物的叶子表面都布满了气孔——根据光线和湿度开合的微小孔隙。气孔打开时可以让二氧化碳进来,用于光合作用。但是气孔打开也会导致植物体内的水分蒸发。犹他州立大学(Utah State University)的植物学家莫特(Keith Mott)、物理学家皮克(David Peak)和他们的同事长期观察叶子气孔的开合模式,他们认为气孔组成了一个有点类似于二维元胞自动机的网络。他们还发现气孔开合的时间模式很像二维形式的粒子相互作用。他们猜测植物通过气孔进行分布式计算——通过优化气孔的开合让二氧化碳的获取和水分流失达到最佳平衡——这种计算也许也能用粒子语言进行解释。”
十二、生命系统中的信息处理
“对于传统计算机的程序,我们(至少)可以从两个层面来看:机器码层面和编程语言层面。在机器码层面上,程序是由具体的让机器一步一步执行的低级指令组成(例如,“将内存中地址n的数据移到CPU的寄存器j”,“对CPU寄存器j和i中的数据执行或逻辑运算,将结果存入内存中地址m处”,等等)。而在编程语言层面上,程序是由BASIC或JAVA这样的高级语言的指令组成,让人更容易理解(例如,“将某个变量乘以2,并将结果赋给另一个变量”,等等)。一个高级语言指令通常要用几个低级指令来实现,不同的计算机类型可能有不同的实现。因此高级语言程序可以以不同的方式实现为机器码;高级语言是对信息处理更抽象的描述。”在这一章作者具体介绍了三个去中心化的生命系统的例子:免疫系统、蚁群、生物代谢。
十三、如何进行类比
有一个很重要的能力现在的计算机还不具备,那就是进行类比。作者所说的类比是“在两个表面上不同的事物之间发现抽象的相似性的能力”。确实是这样,例如模式识别中运用现在所谓的人工智能技术效果仍然不尽人意。作者在本书中介绍了字符串类比的例子。
十四、计算机模型
复杂系统的理想模型也能为新的技术和计算方法提供灵感。作者再此提出了社会科学中的几个理想模型“囚徒困境”、“囚徒困境的扩展”。
第四部分 网络
“世界很复杂,世界又很小。”
十五、网络科学
“对各种网络的共性的研究,无论是仿真还是统计大量真实数据,都只有在计算机的速度足够快之后才可能做到。”“网络思维意味着关注的不是事物本身,而是事物之间的关系。”这一章中作者以通俗易懂的语言和举例子的方式来介绍网络以及网络的稳健性。
十六、真实世界中的网络
大脑、基因调控网络、代谢网络、流行病、生态与食物网。
关于流行病,此时的新型冠状病毒(2019-nCoV)所引发的病毒性肺炎也属于流行病。(流行病指可以感染众多人口的疾病,但不一定为传染病。流行病可以只是在某地区发生,亦可以是全球性的大流行。——维基百科)此时,中心节点的移除就对我们非常有利。但是如果绘制不出整个网络,又如何识别中心节点呢?一些网络科学家团体提出了一种方法:从风险人群中随机选取一组人,每个人都写出密切接触者的名字,找出名单上出现频率最高的。这种方法也可以用到其他场合,用来进行“中心节点打靶”。除去网络的连接问题,此外,作者也对网络的重要功能:传递信息做了介绍。
十七、比例之谜
网络的思想对许多科学领域都有深刻影响,尤其是生物学。又为生物学中一个最让人费解的难题提出了新的解答:生物的大小发生变化时其它属性会如何变化。
人们很早就发现动物的代谢与体型大小存在着一定的比例关系。这是为什么?作者在书中介绍了一次跨学科合作布朗、恩奎斯特和韦斯特认为“代谢率应当主要是由向细胞输送原料的效率决定的。而输送原料是生物循环系统的工作。”同时作者也简单介绍了“幂律与分形”。
十八、进化,复杂化
“进化是如何创造出复杂性,或者说是否能创造复杂性,以及生物复杂性该如何刻画和度量,这些问题都还没有解决。复杂系统研究几十年来最重要的贡献之一就是为这些老问题提供了一些新的研究途径。”这一章介绍了遗传学和基因调控学方面的内容,为复杂系统进化带来了新的认识。
生物系统的复杂性来源于基因网络,而不是单个基因的简单相加。同时这也对前面提出的还原论给与了新的否定例子。
第五部分 尾声
我要将混沌放入十四行诗,让他留在那里,让他从此逃遁。如果他幸运,让他变形、伪装,
洪水、火焰、恶魔——他机敏的谋划,在甜美秩序的严格界限中游刃有余,在道貌岸然的强暴中,我抓住了他的本质和易变的模样,直到他与秩序混合交叠。日复一日,年复一年,他傲慢自大,我们卑躬屈膝:我抓住了他。他只不过是简单却没有被理解之物。我甚至不会逼他忏悔;或是坦白。我只是将他驯服。
——埃德娜·圣文森特·米莱(Edna St.Vincent Millay)
关于复杂性问题我们还没有一个清晰地认识,直到现在也没有抽象出来形成一个完整的边界分明的学科。而对于普通大众来说只是知道有些问题是需要用到这方面的知识来解决的。以前人们认为物理中拥有万有理论就能掌握一切,但由此来看,至少复杂问题还不能解决。
本书附录即是《泛在》杂志对作者Melanie Mitchell 的访谈。
关于这本书,我觉得作者通过对生命系统、计算机、物理学等方面的叙述给读者呈现出了由表观现象到分析对比再到相应复杂系统之间的联系的过程。而对于自己也是有很大启发的:
①尽管现在的各个学科分类相比以前已经越来越细化,但跨学科之间存在的联系也让自己感到惊叹。而进一步引申遇到某一问题难以解决时,跳出现有的思维模式也就变得尤为重要了。
②很多事情是要以全局观来看待。
③尽管概率和不确定充斥着我们的生活,但是总体表现出的规律和一致性相对于整体事物的把握是占一定主导地位的。
④注重反馈与调整、简化与联系。尽管本书叫《复杂》讲的也比较“杂”,但简单的规则所体现出的能量对于推动事物的发展不可估量。
此外本书还有很多值得回味和细细品读的地方,“一千个人心中有一千个哈姆雷特”,就算同一个人所处的时间和境遇不同时,对事物的看法也会大相径庭。希望本书对每一个读者都有启发。