線上社交網路群體健康度

群體子空間健康度用來同時衡量群體在結構上的內聚程度和在屬性子空間上的屬性相似度。

基本介紹

  • 中文名:群體子空間健康度
  • 外文名:community subspace fitness
一. 定義,二. 群體子空間健康度的表示,

一. 定義

群體子空間健康度用來同時衡量群體在結構上的內聚程度和在屬性子空間上的屬性相似度。群體子空間健康度基於群體健康度定義,健康度衡量群體的結構內聚程度,為群體內節點內部度之和與總度之和之比。當群體內部邊越多,跨越群體邊界的邊越少,該群體的健康度越大,因此最大化健康度可以發現結構特徵好的群體。除了結構特徵,群體還需要具有很強的屬性特徵,即群體內部節點互相相似,內部節點與外部節點不相似。屬性特徵和結構特徵可以基於屬性子空間相似度合成起來。將節點對之間的屬性子空間相似度作為該節點對之間邊的權值,則群體子空間健康度定義為群體內部邊權值之和與群體內部節點所有關聯邊權值之和的比值。

二. 群體子空間健康度的表示

一個社交網路被表示為一個3元組
,其中{\cal V}表示節點集,
表示邊集,
表示一個屬性函式。
是節點v的屬性向量。
表示屬性全空間中的屬性集合,
表示屬性r的值域。採用屬性向量之間的指數核作為屬性相似度,即
,式中
是一個尺度參數,
表示兩個屬性向量之間的歐式範數。由於是在屬性子空間下挖掘群體,需要考慮群體屬性子空間特徵,因此採用子空間加權歐式範數,即
式中
是對應於子空間D的子空間向量,滿足歸一化條件。子空間向量中的元素
表示子空間D中屬性i的重要性。基於定義的屬性相似度,將網路重新加權為
,其中
定義為
式中,I是一個指示函式。則群體C的子空間健康度定義為
最大化子空間健康度不僅使群體內部邊較多,群體邊界邊較少,還使群體內節點在子空間下更加相似,而與群體外節點更加不同。

相關詞條

熱門詞條

聯絡我們