㈠ 图数据挖掘:幂律分布和无标度网络
图数据挖掘中的幂律分布与无标度网络:
幂律分布: 定义:幂律分布是一种概率分布,其互补累计分布函数满足特定条件时,网络的节点数量分布呈现出幂函数的下降趋势。 特性:节点度数随规模的增大而以较慢的速度减少,形成重尾分布。为确保概率分布的合理性,会引入归一化常数。 数学特性:幂律分布的数学期望并非总是明确的,特别是当指数较大,方差过大时,平均值可能变得毫无意义。
无标度网络: 定义:无标度网络是指遵循幂律分布的网络,与传统的ER随机图截然不同。 特性:具有独特的弹性特质,面对随机攻击时展现出难以瓦解的稳定性,但对针对性攻击较为敏感。 内部连接模式:无标度网络的韧性源于其内部连接模式,如优先连接模型。新加入的节点更倾向于与已有的高连接度节点建立联系,形成“富者愈富”的现象,这导致了幂律分布的自然形成。
幂律分布与无标度网络在图数据挖掘中具有重要意义,它们揭示了现实网络结构的非凡规律,为我们理解网络世界的复杂性和动态性提供了重要视角。