###1. 图基本概念
####数学方式表示社会网络
~~
方式 | 优点 | 缺点 |
---|---|---|
邻接矩阵 | 零单元所占据的空间大,社交网络规模越大,密度(零/非零)越小(<0.1%) | |
边列表 | 和SQL形成完美映射 | |
临界列表 |
####遍历 Traversal
networkx.traversal.dfs_edges()
networkx.traversal.dfs_tree()
networkx.traversal.bfs_edges()
networkx.traversal.bfs_tree()
####路径 Paths
networkx.algorithm.shortest_path()
####图的距离: 节点和邻居如何联系
- 最短路径
- 成本最短路径
- 欧几里得距离: 欧式距离短表示结构,作用相似
###2. 节点层面分析
####社会网络的取样和数据采集法
####中心性 权力和影响力
- 程度中心性 Degree Centrality:粉丝数量
- 亲近中心性 Close Centrality:与其他点的距离
- 居间中心性 Betweenness Centrality:经过该点的最短路径的数量(跨界者)
- 特征向量中心性:
- PageRank
###3. 群体层面分析 ####子图——自我中心网 ####岛屿方法
#trim
def trim_degree(g,degree=1):
g2 = g
d = g2.degree()
for n in g2.nodes():
if d[n]<= degree: g2.remove_node(n)
return g2
trim_degree(g,2)
print len(g)
nx.draw(g,with_labels= True)