㈠ 圖數據挖掘:冪律分布和無標度網路
圖數據挖掘中的冪律分布與無標度網路:
冪律分布: 定義:冪律分布是一種概率分布,其互補累計分布函數滿足特定條件時,網路的節點數量分布呈現出冪函數的下降趨勢。 特性:節點度數隨規模的增大而以較慢的速度減少,形成重尾分布。為確保概率分布的合理性,會引入歸一化常數。 數學特性:冪律分布的數學期望並非總是明確的,特別是當指數較大,方差過大時,平均值可能變得毫無意義。
無標度網路: 定義:無標度網路是指遵循冪律分布的網路,與傳統的ER隨機圖截然不同。 特性:具有獨特的彈性特質,面對隨機攻擊時展現出難以瓦解的穩定性,但對針對性攻擊較為敏感。 內部連接模式:無標度網路的韌性源於其內部連接模式,如優先連接模型。新加入的節點更傾向於與已有的高連接度節點建立聯系,形成「富者愈富」的現象,這導致了冪律分布的自然形成。
冪律分布與無標度網路在圖數據挖掘中具有重要意義,它們揭示了現實網路結構的非凡規律,為我們理解網路世界的復雜性和動態性提供了重要視角。