网络,和一般我们所说的互联网并不完全相同,代表着多个对象及其相互联系,代表着一种个体之间的组织排列方式。
也就是说,研究网络并不仅仅是研究互联网,而是研究一种普遍存在于世界的组织方式:从社会关系网到生态圈,从细胞互动到企业组织设计,甚至脑神经科学。
网络的基本结构和测量
网络有两种基本组件:边和节点。其中边可以标记方向,也可以不标记方向。
测量网络的一些基本工具
degree:节点有几条边相连
path length:点到点的距离。一般衡量点到点的距离的单位使用的是边的数量(要经过几条边)
connectedness:用以衡量网络当中的隔离程度。比如connected graph中,任何一点都可以通过一条或多条路径连接到任意一点。
clustering coeffcient:用以测量节点之间连接密度(被三边相连的三点组/可能的三点的组)网络根据其节点与节点之间连接的方式可以大体分成三种,这三种网络也是人类对网络认识越来越深后对网络的认知的三个阶段。
三种网络
三种网络的区分的形成源自节点之间相互连接的规则的不同。
随机网络
随机网络是指每个节点都有相同的概率与其他节点相连的网络。如果一个随机网络中的节点数量足够多时,几乎每一个节点都有接近的连接数量,换句话说,会形成一个“平等的网络”。
随机网络的形成需要节点在和其他节点产生连接时做到“一视同仁”,这使得其适用范围被极大的缩小了。因为,在人类社会中,几乎任何人际关系的形成都不是完全随机的,或是受到地理分隔的影响,其他还有诸如“富者愈富”的“明星效应”。类似的“地理分隔”和“富者愈富”以类似的机理也存在于神经元网络中(与就近的神经元建立联系and,一个神经元已有的连结越多越有可能产生新的链接),存在于互联网之中(主要是明星效应),甚至流行病传播网络之中。
因此随机网络经常以一种“事物真实摸样的简化版”的形式出现,或者在用以描述某类人造场景(游戏)时得以发挥作用。
森林火灾
之前的森林火灾模型有着和随机网络相似的逻辑。
首先我们有一片森林,相当于一个网络,其中的树木就是网络中的节点。接着我们假设森林总体有一个密度,这相当于同时设置了节点和节点之间进行连接的概率和节点的数量。假设发生火灾,这个森林会有多大范围遭到破坏呢?使用森林火灾模拟器之后发现,当密度低于百分之五十五时,火灾几乎不会对森林造成太大的影响(低于3%),但是一旦密度处于55%-60%,森林被破坏的程度迅速上升(大约65%),因此55%-60%这个区间可以被称为阈值。
随机网络也存在一个类似的阈值,这个阈值为1,也就是当网络足够大而且每个节点拥有的平均链接数大于1时,整个网络被连接了起来,而不再是支离破碎的节点簇。换句话说,如果我们每个人平均有大于一个朋友,那几乎每个人都会被连入到社会这个网络。从这种意义上来说,我们多数人并没有那么孤独。
小世界
小世界网络中的节点与就近的节点连接概率更高,然后少数随机连接较远的节点。小世界网络的是另一种网络组成的形式,在这种网络中的节点会与距离较近的节点更容易产生链接,与较远的节点则概率更低。因此这里存在两个连接概率,C (close)和 D (distant)。
地理分隔
小世界网络常常是因为地理分隔形成的。这会让网络形成一种几个节点聚在一起形成内部紧密连接的节点簇,节点簇之间的连接则颇为零散,像是很多个较大的毛线球,彼此靠着几根较长的毛线连接着。
群体分隔
虽然一般谈到小世界网络的形成更强调地理分隔的重要性,但是地理分割这个概念仍然可以继续分解,即:地理分割的本质是存在地理的限制导致信息传递成本有所不同。因此事情的本质其实是不同的信息传递成本。
而这种不同的信息传递成本并不仅仅是地理原因所致,也可以是,比如说,认知不同造成的信息传递成本(比如年龄代沟),语言,文化不同造成的差异(族群聚团现象),甚至是性别不同,政策不同(人为因素)也可以产生这种信息传递成本的差异。
但不可否认,地理分割造成的信息传递成本差异一般是比较大的,所以是一个主要的影响因素。因为有这种信息传递成本的差异(当然不止是这个因素),人们被割裂成了各种各样的团体,例如“中国留学生”,“LGBTQ群体”,“壁球爱好者”,“享乐主义者”等等。这些团体中的人(节点)互相连接的可能性更高,而跨圈连接的可能性则相对更小。
偏好连接
偏好连接是说网络中节点在与其他节点连接时,具有一定的偏好,下面讨论一下比较常见的两种偏好。
第一种偏好是一种正反馈效应的偏好,即:对于网络中的节点,已有的连接越多,越可能建立新的连接。把这种网络叫做无尺度网络。这种效应自然界和人类社会普遍存在,在人类社会中可以叫做“流量”,“知名度”。
这其中的关键类似路径依赖:每一次被选择,就增加下一次被选择的概率。于是富者愈富,强者恒强。基于这种正反馈的偏好链接的网络具备几个特点
1. 连接数的幂律分布:由于正反馈,大多数点的连接数并不多,但极少数点会具备大量链接。或者说产生所谓的枢纽节点。(横轴:链接数,纵轴:对应节点数)
2. 先发优势:越早出现的节点越有可能在其他节点尚未出现之前就积攒了一定量的链接,因此也具备更高的未来连接的可能性。
3. 健壮与脆弱并存:无尺度网络同时具备健壮性和脆弱性。
健壮部分是指,由于网络中大部分节点拥有较少的链接,因此网络具备一定的容错性,即使部分节点被破坏,网络的连接度仍然较高。
脆弱的部分是指,应对针对性打击(攻击枢纽节点)网络容易受到巨大破坏。就像呼和浩特机场如果停用可能并不会对航班网络造成较大影响,但首都国际机场却会牵一发动全身。
偏好连接的第二种模式,是根据某些节点自身的特点来确定与其他节点建立连接的概率。这种连接概率也可以叫做适应度,比如在人际关系网络中,社交能力强一般意味着更高的适应度。这种模式往往和第一种模式一起出现,其原因在于人们需要一个”发现“算法。
例如,明星与粉丝的互动网络一方面与明星自身的综合能力有关,但同时曝光度也有重要影响:一个明星越有名,他也容易变的更加有名。再比如,大多数人使用浏览器一方面是因为浏览器自身的检索能力,但同时受到浏览器”知名度“的影响,or”大家都在用“。正是由于第二种模式的存在,理论中我们的社会没有变成一个阶级完全固化的石板。基于自身特点的链接方式是打破先发效应的金钥匙,在先来者占据着先发优势的资源洋洋得意时,后发者因为自身特点(or适应度if you may)赋予的更高连接概率而后来居上。
网络的影响
是风险也是机遇
一些网络具备强烈的偏好链接的性质。比如,艾滋病传播的网络。艾滋病的一大主要传播途径是性行为,而经过一些调查发现,在艾滋病患者的性关系网中,大多数节点(患者)有着非常少的连接,但是却有少数患者有着非常多的连接,这使得他们成了”超级传染者“。根据上文提到的“枢纽节点的脆弱性”,这也许给了艾滋病预防机构一个启发,相比于对所有患者一视同仁的治疗,是否应该给予”超级传播者“更多关注从而减少艾滋病的扩散。此类事物还有很多,通过研究其网络结构,我们往往可以得到常规方法之外的启发。
弱关系
弱关系指的是跨越节点簇的关系。在小世界的部分我们提到过,因为地理分割等原因,我们偏向与周围的人建立较为紧密的关系,而这些人互相之间也存在链接,因此形成了一个节点簇。然而,在这样一个强关系的节点簇中,大家互相认识,往往也分享着相似的信息源。也就是说,我的好朋友获得的信息,我大部分也能获得。这侧面体现了弱关系的作用,因为弱关系涉及跨越节点簇,这时我们关注的不仅是那个身处节点簇的朋友,还同时是这位朋友的朋友。这使得我们完成了信息来源的跨越。
大学就存在这样的结构,每个院系内部的同学互相联系更加紧密,但同时同质化程度也较高。而如果有不少其他院系的朋友,就可以更多的接触其他来源的信息,往往可以带来意想不到的启发。这都体现了弱关系的重要性。
流行与传播
疾病的传递与时尚,新闻的流行有着相同的机理。三者都存在一个阈值,当被传播的事物的传播率超过一个阈值时,几乎所有人都会感染or知道这个新闻。不同的是,疾病如果被感染有几率痊愈,而痊愈之人则不具备传染性,因此一般不会出现全体感染的情况,但是新闻会。