從原始邊列表到鄰接矩陣Python實現圖數據處理的完整指南

本文分享自華爲雲社區《從原始邊列表到鄰接矩陣Python實現圖數據處理的完整指南》，作者：檸檬味擁抱。

在圖論和網絡分析中，圖是一種非常重要的數據結構，它由節點（或頂點）和連接這些節點的邊組成。在Python中，我們可以使用鄰接矩陣來表示圖，其中矩陣的行和列代表節點，矩陣中的值表示節點之間是否存在邊。

原始邊列表

假設我們有一個原始邊列表，其中每個元素都表示一條邊，例如：

edges = [(0, 1), (0, 2), (1, 2), (2, 3)]

在這個例子中，每個元組 (a, b) 表示節點 a 和節點 b 之間存在一條邊。

轉換爲鄰接矩陣

我們首先需要確定圖中節點的數量，然後創建一個相應大小的零矩陣。接着，我們遍歷原始邊列表，根據每條邊的兩個節點，將對應的矩陣元素設爲 1。最終得到的矩陣就是我們所需的鄰接矩陣。

讓我們來看看如何用Python代碼實現這一過程：

def edges_to_adjacency_matrix(edges):
    # 找到圖中節點的數量
    max_node = max(max(edge) for edge in edges) + 1
    
    # 創建零矩陣
    adjacency_matrix = [[0] * max_node for _ in range(max_node)]
    
    # 遍歷原始邊列表，更新鄰接矩陣
    for edge in edges:
        adjacency_matrix[edge[0]][edge[1]] = 1
        adjacency_matrix[edge[1]][edge[0]] = 1  # 如果是無向圖，邊是雙向的
    
    return adjacency_matrix

# 測試
edges = [(0, 1), (0, 2), (1, 2), (2, 3)]
adjacency_matrix = edges_to_adjacency_matrix(edges)
for row in adjacency_matrix:
    print(row)

在這段代碼中，edges_to_adjacency_matrix 函數接受原始邊列表作爲參數，並返回對應的鄰接矩陣。然後我們對給定的邊列表進行了測試，並輸出了生成的鄰接矩陣。

擴展和優化

雖然上述代碼能夠完成原始邊列表到鄰接矩陣的轉換，但在實際應用中可能需要進行一些擴展和優化。

處理有向圖和無向圖：目前的代碼默認處理無向圖，如果是有向圖，需要根據具體需求修改代碼，只在一個方向上設置鄰接關係。
處理權重：有時邊不僅僅是存在與否的關係，還可能有權重。修改代碼以支持帶權重的圖。
使用稀疏矩陣：對於大型圖，鄰接矩陣可能會佔用大量內存，可以考慮使用稀疏矩陣來節省內存空間。
性能優化：對於大規模的邊列表，需要考慮代碼的性能。可以嘗試使用更高效的數據結構或算法來實現轉換過程。

下面是對代碼的一些優化示例：

import numpy as np

def edges_to_adjacency_matrix(edges, directed=False):
    max_node = max(max(edge) for edge in edges) + 1
    adjacency_matrix = np.zeros((max_node, max_node))
    for edge in edges:
        if directed:
            adjacency_matrix[edge[0]][edge[1]] = 1
        else:
            adjacency_matrix[edge[0]][edge[1]] = 1
            adjacency_matrix[edge[1]][edge[0]] = 1
    return adjacency_matrix

# 測試
edges = [(0, 1), (0, 2), (1, 2), (2, 3)]
adjacency_matrix = edges_to_adjacency_matrix(edges)
print("無向圖的鄰接矩陣：")
print(adjacency_matrix)

directed_edges = [(0, 1), (0, 2), (1, 2), (2, 3)]
directed_adjacency_matrix = edges_to_adjacency_matrix(directed_edges, directed=True)
print("\n有向圖的鄰接矩陣：")
print(directed_adjacency_matrix)

在優化後的代碼中，我們使用了NumPy庫來創建和操作矩陣，這可以提高代碼的性能和可讀性。同時，我們添加了一個參數 directed 來指示圖的類型，從而支持有向圖和無向圖的轉換。

使用稀疏矩陣優化內存佔用

在處理大型圖時，鄰接矩陣可能會變得非常稀疏，其中大部分元素都是零。爲了優化內存佔用，可以使用稀疏矩陣來表示鄰接關係。

Python中有多種庫可以處理稀疏矩陣，其中Scipy庫提供了稀疏矩陣的各種操作和算法。讓我們來看看如何使用Scipy中的稀疏矩陣來優化代碼：

import numpy as np
from scipy.sparse import lil_matrix

def edges_to_adjacency_matrix(edges, directed=False):
    max_node = max(max(edge) for edge in edges) + 1
    adjacency_matrix = lil_matrix((max_node, max_node), dtype=np.int8)
    for edge in edges:
        if directed:
            adjacency_matrix[edge[0], edge[1]] = 1
        else:
            adjacency_matrix[edge[0], edge[1]] = 1
            adjacency_matrix[edge[1], edge[0]] = 1
    return adjacency_matrix

# 測試
edges = [(0, 1), (0, 2), (1, 2), (2, 3)]
adjacency_matrix = edges_to_adjacency_matrix(edges)
print("無向圖的鄰接矩陣：")
print(adjacency_matrix.toarray())

directed_edges = [(0, 1), (0, 2), (1, 2), (2, 3)]
directed_adjacency_matrix = edges_to_adjacency_matrix(directed_edges, directed=True)
print("\n有向圖的鄰接矩陣：")
print(directed_adjacency_matrix.toarray())

在這個版本的代碼中，我們使用了 scipy.sparse.lil_matrix 來創建稀疏矩陣。它能夠有效地處理大型稀疏矩陣，並且只存儲非零元素，從而節省內存。

通過這種優化，我們可以處理更大規模的圖數據，而不會因爲內存佔用過高而導致性能下降或內存不足的問題。

處理帶權重的邊列表

在某些情況下，圖的邊不僅僅表示節點之間的連接關係，還可能有權重信息。例如，在交通網絡中，邊可以表示道路，而權重可以表示道路的長度或通行時間。

讓我們來看看如何修改代碼，以支持帶權重的邊列表：

import numpy as np
from scipy.sparse import lil_matrix

def edges_to_adjacency_matrix(edges, directed=False, weighted=False):
    max_node = max(max(edge[0], edge[1]) for edge in edges) + 1
    adjacency_matrix = lil_matrix((max_node, max_node), dtype=np.float32)
    for edge in edges:
        if directed:
            if weighted:
                adjacency_matrix[edge[0], edge[1]] = edge[2]
            else:
                adjacency_matrix[edge[0], edge[1]] = 1
        else:
            if weighted:
                adjacency_matrix[edge[0], edge[1]] = edge[2]
                adjacency_matrix[edge[1], edge[0]] = edge[2]
            else:
                adjacency_matrix[edge[0], edge[1]] = 1
                adjacency_matrix[edge[1], edge[0]] = 1
    return adjacency_matrix

# 測試
weighted_edges = [(0, 1, 5), (0, 2, 3), (1, 2, 2), (2, 3, 7)]
weighted_adjacency_matrix = edges_to_adjacency_matrix(weighted_edges, weighted=True)
print("帶權重的鄰接矩陣：")
print(weighted_adjacency_matrix.toarray())

在這個版本的代碼中，我們添加了一個 weighted 參數來指示邊是否帶有權重。如果 weighted 參數爲 True，則從邊列表中提取權重信息，並將其保存到鄰接矩陣中。否則，鄰接矩陣中的值仍然表示邊的存在與否。

通過這種修改，我們可以處理帶有權重信息的圖數據，並在鄰接矩陣中保留這些信息，以便進行後續的分析和計算。

圖的可視化

在處理圖數據時，可視化是一種強大的工具，它可以幫助我們直觀地理解圖的結構和特徵。Python中有許多庫可以用來可視化圖數據，其中NetworkX是一個常用的庫，它提供了豐富的功能來創建、操作和可視化圖。

讓我們來看看如何使用NetworkX來可視化我們生成的鄰接矩陣：

import networkx as nx
import matplotlib.pyplot as plt

def visualize_adjacency_matrix(adjacency_matrix):
    G = nx.from_numpy_matrix(adjacency_matrix)
    pos = nx.spring_layout(G)  # 定義節點位置
    nx.draw(G, pos, with_labels=True, node_color='skyblue', node_size=500, font_size=10)  # 繪製圖
    edge_labels = {(i, j): w['weight'] for i, j, w in G.edges(data=True)}  # 獲取邊權重
    nx.draw_networkx_edge_labels(G, pos, edge_labels=edge_labels, font_size=10)  # 繪製邊權重
    plt.title("Graph Visualization")
    plt.show()

# 測試
weighted_edges = [(0, 1, 5), (0, 2, 3), (1, 2, 2), (2, 3, 7)]
weighted_adjacency_matrix = edges_to_adjacency_matrix(weighted_edges, weighted=True)
print("帶權重的鄰接矩陣：")
print(weighted_adjacency_matrix.toarray())

visualize_adjacency_matrix(weighted_adjacency_matrix.toarray())

在這段代碼中，我們首先使用NetworkX的 from_numpy_matrix 函數將鄰接矩陣轉換爲圖對象。然後使用 spring_layout 定義節點的位置，並使用 draw 函數繪製圖。最後，我們使用 draw_networkx_edge_labels 函數繪製邊的權重。

通過可視化，我們可以清晰地看到圖的結構，並直觀地瞭解節點之間的連接關係和權重信息。

鄰接矩陣轉換爲原始邊列表

在圖數據處理中，有時候我們需要將鄰接矩陣轉換回原始的邊列表形式。這在某些算法和應用中可能很有用，因爲一些算法可能更適合使用邊列表來表示圖。

讓我們看看如何編寫代碼來實現這一轉換：

import numpy as np

def adjacency_matrix_to_edges(adjacency_matrix):
    edges = []
    for i in range(adjacency_matrix.shape[0]):
        for j in range(adjacency_matrix.shape[1]):
            if adjacency_matrix[i, j] != 0:
                edges.append((i, j, adjacency_matrix[i, j]))
    return edges

# 測試
adjacency_matrix = np.array([[0, 1, 0, 0],
                              [1, 0, 1, 0],
                              [0, 1, 0, 1],
                              [0, 0, 1, 0]], dtype=np.float32)
print("原始鄰接矩陣：")
print(adjacency_matrix)

edges = adjacency_matrix_to_edges(adjacency_matrix)
print("\n轉換後的邊列表：")
print(edges)

在這段代碼中，我們遍歷鄰接矩陣的每個元素，如果元素的值不爲零，則將其轉換爲邊列表中的一條邊。對於有權重的圖，我們將權重信息也一併保存在邊列表中。

通過這個轉換過程，我們可以將鄰接矩陣表示的圖轉換爲邊列表形式，從而方便進行一些算法的實現和應用。

總結與展望

本文介紹瞭如何使用Python將原始邊列表轉換爲鄰接矩陣，並進行了一系列的擴展和優化，以滿足不同場景下的需求。我們從處理無向圖和有向圖、帶權重的邊列表，到使用稀疏矩陣優化內存佔用，再到圖的可視化和鄰接矩陣轉換爲原始邊列表，覆蓋了圖數據處理的多個方面。

在實際應用中，圖數據處理是一個非常重要且廣泛應用的領域，涉及到網絡分析、社交網絡、交通規劃、生物信息學等諸多領域。掌握圖數據處理的技能，能夠幫助我們更好地理解和分析複雜的數據結構，從而解決實際問題。

未來，隨着數據規模的不斷增大和複雜性的增加，圖數據處理領域將面臨更多挑戰和機遇。我們可以期待更多高效、靈活和功能豐富的工具和算法的出現，以應對不斷變化的需求和挑戰。同時，我們也可以持續學習和探索，不斷提升自己在圖數據處理領域的能力和水平，爲解決實際問題做出更大的貢獻。

希望本文對你理解和應用圖數據處理有所幫助，也歡迎你進一步深入學習和探索這個領域，爲數據科學和工程的發展貢獻力量。

點擊關注，第一時間瞭解華爲雲新鮮技術~

從原始邊列表到鄰接矩陣Python實現圖數據處理的完整指南

原始邊列表

轉換爲鄰接矩陣

擴展和優化

使用稀疏矩陣優化內存佔用

處理帶權重的邊列表

圖的可視化

鄰接矩陣轉換爲原始邊列表

總結與展望

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

通義千問 2.5 “客串” ChatGPT4，你分的清嗎？

Garnet：微軟官方基於.NET開源的高性能分佈式緩存存儲數據庫

Flink執行圖

Java響應式編程

評估統計算法在銀行僞造鈔票檢測中的價值

Java ThreadPoolShutdown

個人開發者如何入門 Java 異步編程

在Linux操作系統的安裝過程中，如何選擇合適的發行版

前端面試題 - vue的雙向綁定原理是什麼？

5月21日相聚上海張江！與文心大模型一起共建大模型產業應用生態圈

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結