时间:2023-04-26 15:29:02 点击次数:21
↓↓↓ 超全资料库
请加客服:szaz01
欢迎热爱学习的小伙伴,一起自我提升,一起互相帮助,一起长成更优秀的自己!!
-------------以下内容请忽略--------------
为了说明这一网络增长机制,我们首先考虑网页是如何被添加进一个网站的。想象一个有100万个网页的大网站,维护如此巨大的网站,要么需要一个非常多产的供稿者,要么需要一组网站管理员来不断修改、删除和添加网页。还有一种可能是,网站可以自动生成某些网页。在这样一个有100万个网页的大型网站中,如果人们发现一天里新增或消失了几百个网页,一般不会觉得奇怪。再想象一个只有几十个网页的网站,它本身的内容不多,想在这样的网站上发现一天里增加了几百篇网页,虽然并非不可能,但就会是一件不同寻常的事情。于是我们可以比较有把握地说,网站中的网页数量每天的波动与网站大小成正比,如果用数学语言描述这个过程则是,这种增长具有可乘性。换句话说,一个网站某天的网页数量 n ,等于该网站前一天的网页数量加上或者减去 n 的一个随机分数。
如果一组网站的规模以相同的平均增长率但不同的每日随机波动量增长,那么经过足够长的一段时间后,其规模将满足对数正态式的分布。在对数正态式的分布中,出现小规模网站的概率较高,而出现非常大规模的网站的概率虽然低但它的存在会非常显著。尽管对数正态式的分布也是倾斜的,且带有长长的尾巴,但它并不同于幂律分布。
为了解释人们观察到的网站规模的幂律分布特征,我们需要考虑促使网络快速增长的其他两个因素:其一是网站出现的不同时间,其二是网站的不同增长速度。
首先,我们考虑网站出现的不同时间。自互联网诞生以来,网站数量呈指数型增长,这意味着“年轻”的网站要比“年老”的网站多得多。具有相同增长率的网页的网站出现在不同的时间,最初只有少数几个,但随着时间的推移会越来越多。经过足够长的一段时间后,人们发现了一个规律,即网站的网页数量满足于幂律分布。那些“年轻”的网站因为出现的时间不长,处于该分布曲线的波谷;而那些“年老”的网站数量要少得多,更有可能已发展成很大的规模,处于该分布曲线的波峰。
其次,我们需要考虑第二个因素,即所有的网站出现在同一时间,但其增长速度不同。通过计算机模拟,我们发现,不同的网页增长率,无论它们是如何在网站之间分布的,都会使站点规模呈现出幂律分布。网站之间网页增长率的差别越大,分布中的指数 β 越小,就意味着站点大小的不均等性将会增加。
总之,利用一个随机倍增的简单假设,再结合网站出现的不同时间和不同增长速度的事实,我们得以解释网络中普遍存在的幂律分布