Prezentowane materiały są przeznaczone dla uczniów szkół ponadgimnazjalnych Autor artykułu: mgr Jerzy Wałaszek |
©2014 mgr
Jerzy Wałaszek
|
Pojęcia wstępneGraf (ang. graph) jest strukturą danych składającą się z dwóch zbiorów: zbioru wierzchołków (ang. vertices) i zbioru krawędzi (ang. edges), co matematycznie zapisujemy w postaci uporządkowanej pary (tzn. takiej, gdzie istotna jest kolejność elementów tworzących tę parę):
Rząd grafu (ang. graph order) to liczba wierzchołków w grafie. Rozmiar grafu (ang. graph size) to liczba krawędzi w grafie. Wierzchołki grafu przechowują informację, natomiast krawędzie określają sposób poruszania się po grafie: z wierzchołka u można przejść do wierzchołka v tylko wtedy, gdy istnieje ścieżka (ciąg krawędzi), która prowadzi w grafie od wierzchołka u do v. Grafem zerowym (ang. null graph) jest graf, który posiada wierzchołki, lecz nie posiada żadnych krawędzi:
W grafie zwykłym mamy wierzchołki oraz krawędzie, które łączą ze sobą pary wierzchołków grafu:
Wierzchołek nie połączony krawędzią z żadnym innym wierzchołkiem grafu nazywamy wierzchołkiem izolowanym (ang. isolated vertex):
Dane dwa wierzchołki mogą być połączone ze sobą za pomocą więcej niż jednej krawędzi, które nazywamy krawędzią wielokrotną (ang. multi-edge). Również wierzchołek może łączyć się krawędzią z samym sobą. Otrzymujemy wtedy tzw. pętlę (ang. loop). Graf zawierający pętle lub krawędzie wielokrotne nazywamy multigrafem (ang. multigraph).
Graf nie posiadający pętli oraz krawędzi podwójnych nazywamy grafem prostym (ang. simple graph lub strict graph). Krawędź, którą można przebywać tylko w określoną stronę, nazywa się krawędzią skierowaną (ang. directed edge). Na rysunku krawędzie skierowane oznaczamy strzałkami. Graf zawierający krawędzie skierowane nazywamy grafem skierowanym (ang. directed graph) lub w skrócie digrafem (ang. digraph). Graf nie posiadający krawędzi skierowanych nazywamy grafem nieskierowanym (ang. not directed graph). W definicji digrafu zbiór krawędzi tworzą uporządkowane pary wierzchołków (u,v), z których u oznacza wierzchołek początkowy krawędzi, a v wierzchołek końcowy. Krawędź nieskierowana może być przedstawiona jako dwie krawędzie skierowane w przeciwnych kierunkach.
Zwróć uwagę, że w grafie skierowanym mogą istnieć wierzchołki, pomiędzy którymi nie da się przejść, pomimo istnienia łączących je krawędzi. Oto najprostszy przykład:
W grafie tym istnieje droga od wierzchołka v1 do v2, jednakże nie ma drogi powrotnej od v2 do v1, ponieważ łącząca te wierzchołki krawędź może być przebyta tylko w jednym kierunku. Z krawędziami grafu mogą być związane dodatkowe wartości (np. w świecie rzeczywistym pokonanie drogi z jednego miasta do drugiego może wymagać określonej ilości czasu lub energii). Wartości te nazywamy wagami (ang. weight), a graf posiadający takie krawędzie nazywamy grafem ważonym (ang. weighted graph). Graf ważony posiada zbiór krawędzi zbudowany z uporządkowanych trójek, gdzie dwa pierwsze elementy określają wierzchołki połączone daną krawędzią (w grafie skierowanym wierzchołki te są parą uporządkowaną), a trzeci element określa wagę tej krawędzi.
Stopniem wierzchołka (ang. degree) nazywamy liczbę krawędzi, które łączą się z danym wierzchołkiem. Jeśli graf posiada pętle, to liczymy je za 2. W poniższym grafie wierzchołki posiadają następujące stopnie:
W grafie skierowanym rozróżniamy stopień wchodzący (ang. indegree) – liczba krawędzi wchodzących do wierzchołka oraz stopień wychodzący (ang. outdegree) – liczba krawędzi wychodzących z wierzchołka. Wierzchołek izolowany posiada zawsze stopień 0. Ścieżka lub droga (ang. path) jest uporządkowanym ciągiem kolejnych krawędzi, po których należy przejść, aby dotrzeć z wierzchołka startowego (ang. start vertex) do wierzchołka końcowego (ang. end vertex). W grafie może istnieć wiele różnych ścieżek pomiędzy dwoma wybranymi wierzchołkami.
Ścieżki można również definiować za pomocą ciągu kolejno mijanych wierzchołków (oczywistym jest, iż każde dwa kolejne wierzchołki muszą być połączone krawędzią).
Najkrótsza ścieżka (ang. shortest path) to ta, która zawiera najmniej krawędzi/wierzchołków. Długość ścieżki (ang. path length) to liczba zawartych w niej krawędzi/wierzchołków. Mówimy, że ścieżka jest prosta (ang. strait path lub simple path), jeśli każdą krawędź/wierzchołek przechodzimy tylko jeden raz. Cykl (ang. cycle) to ścieżka, która rozpoczyna się i kończy w tym samym wierzchołku. Uwaga: nie myl cyklu z pętlą – pętla to pojedyncza krawędź.
Cykl nazywamy prostym (ang. simple cycle), jeśli każda jego krawędź/wierzchołek jest przechodzona dokładnie jeden raz. Nie odnosi się to oczywiście do wierzchołka startowego i końcowego, które w cyklu muszą być tym samym wierzchołkiem, innymi słowy ścieżka musi być zamknięta. Ścieżka prosta zawierająca wszystkie wierzchołki grafu nosi nazwę ścieżki Hamiltona (ang. Hamiltonian path). Cykl prosty zawierający wszystkie wierzchołki grafu nazywa się cyklem Hamiltona (ang. Hamiltonian cycle). Ścieżka prosta, która przechodzi przez wszystkie krawędzie grafu nazywa się ścieżką Eulera (ang. Eulerian path). Cykl Eulera (ang. Eulerian cycle) to cykl prosty, który przechodzi przez wszystkie krawędzie grafu. Zwróć uwagę, że cykl Eulera i cykl Hamiltona to nie to samo! W cyklu Hamiltona ważne jest przejście przez wszystkie wierzchołki dokładnie jeden raz (niektóre krawędzie grafu mogą być w ogóle nie przechodzone). W cyklu Eulera z kolei musimy przejść przez każdą krawędź, zatem niektóre wierzchołki mogą zostać kilkakrotnie odwiedzone, jeśli łączą się z kilkoma krawędziami. Graf nazywamy acyklicznym (ang. acyclic graph), jeśli nie posiada żadnych cykli. Graf nazywamy planarnym (ang. planar graph), jeśli da się go narysować na płaszczyźnie, tak aby żadne jego krawędzie się nie przecinały.
Jeśli graf jest planarny, to spełnia wzór Eulera (jeśli graf nie spełnia tego wzoru, to na pewno nie jest planarny):
|E| ≤ 3 • |V| – 6
gdzie: |E| – liczba krawędzi w grafie
Graf pełny (ang. complete graph) jest grafem, w którym każda para wierzchołków łączy się krawędzią. Grafy pełne o n wierzchołkach oznacza się symbolem Kn. Graf pełny o n wierzchołkach posiada krawędzi. Poniżej przedstawiamy kilka początkowych grafów pełnych:
Grafy pełne od K5 w górę nie są planarne. Resztę definicji i pojęć związanych z grafami podamy zgodnie z potrzebami. W następnym rozdziale zajmiemy się podstawowymi sposobami reprezentacji grafów w komputerze. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Do reprezentacji grafów w pamięci komputera wymyślono kilka różnych struktur danych. Każda z nich posiada swoje zalety, lecz również wady. Dlatego należy je rozsądnie dobierać do zadań, w których używamy grafów. Źle dobrana reprezentacja może znacząco wydłużyć czas obliczeń lub rozmiar zajmowanej pamięci. Graf zwykle nie jest strukturą hierarchiczną, jak np. opisane wcześniej drzewa. Jego węzły nie muszą się ze sobą łączyć w określony sposób. Mogą również istnieć grupy węzłów, które nie są w żaden sposób połączone z innymi. Dlatego sposoby reprezentacji drzew niezbyt nadają się do reprezentacji grafów, która powinna zapewniać dostęp do wszystkich wierzchołków bez względu na ich wzajemne połączenia krawędziami. Takie cechy posiadają tablice i macierze. W rozdziale tym omawiamy trzy najczęściej spotykane sposoby przedstawiania grafów: macierz sąsiedztwa (ang. adjacency matrix), macierz incydencji (ang. incidence matrix) oraz listy sąsiedztwa (ang. adjacency lists). Cechą charakterystyczną tych implementacji jest wykorzystanie tablic do przechowywania danych na temat wierzchołków lub łączących je krawędzi. Wykorzystuje się również struktury mieszane, np. tablicę, której elementami są listy. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Wprowadzanie grafu do pamięci komputera
Chcąc realizować algorytmy grafowe, będziemy zmuszeni wprowadzać różne
grafy do pamięci komputera. Istnieje bardzo prosty sposób realizacji
tego zadania i jest on następujący:
Na początku podajemy dwie liczby n – ilość wierzchołków oraz m – ilość krawędzi. Następnie wprowadzamy m par liczb a i b, które definiują kolejne krawędzie grafu, gdzie a to wierzchołek startowy, a b wierzchołek końcowy (dla grafu nieskierowanego kolejność tych wierzchołków nie ma znaczenia). Umówmy się dodatkowo, że wierzchołki w grafie posiadają numery od 0 do n-1. Kolejność numeracji wierzchołków nie ma znaczenia. Dla porządku krawędzie również będą numerowane od 0 do m-1. Dzięki tej umowie uprości się tworzenie struktur danych w języku C++, gdzie, jak pamiętamy, indeksy tablic rozpoczynają się od 0. Przykład:
Jeśli krawędzie będą posiadały wagi, to warości tych wag podamy jako trzecią liczbę w definicji krawędzi. Przykład:
Jeśli z wierzchołkami grafu zechcemy skojarzyć dane, to po podaniu dwóch pierwszych liczb n i m najpierw przekazujemy do programu n danych dla wierzchołków, a następnie m par (lub trójek) dla poszczególnych krawędzi. Przykład:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Macierz sąsiedztwa
Graf reprezentujemy za pomocą macierzy kwadratowej A o stopniu n,
gdzie n oznacza liczbę wierzchołków w grafie. Macierz
tą nazywamy macierzą sąsiedztwa
(ang. adjacency matrix). Odwzorowuje ona
połączenia wierzchołków krawędziami. Wiersze macierzy sąsiedztwa
odwzorowują zawsze wierzchołki startowe krawędzi, a kolumny
odwzorowują wierzchołki końcowe krawędzi. Komórka A[i,j],
która znajduje się w i-tym wierszu i j-tej kolumnie
odwzorowuje krawędź łączącą wierzchołek startowy vi
z wierzchołkiem końcowym
vj. Jeśli A[i,j] ma wartość 1, to
dana krawędź istnieje. Jeśli A[i,j] ma wartość 0, to
wierzchołek vi nie łączy się krawędzią z
wierzchołkiem vj.
Przykład:
Dla grafu nieskierowanego macierz sąsiedztwa A jest symetryczna względem głównej przekątnej, ponieważ jeśli istnieje krawędź od vi do vj (A[i,j] = 1), to również musi istnieć krawędź w kierunku odwrotnym, od vj do vi (A[j,i] = 1). Przykład:
Interpretacja zawartości macierzy sąsiedztwa jest bardzo prosta. Poszczególne wiersze traktujemy jako wierzchołki grafu. Zatem wiersz 0 odpowiada wierzchołkowi v0, wiersz 1 odpowiada wierzchołkowi v1, itd. Weźmy dla przykładu wiersz nr 3, który odpowiada wierzchołkowi v3:
W kolumnach o numerach 0, 2 i 4 mamy wartości 1. Oznacza to, że wierzchołek v3 jest połączony krawędziami kolejno z wierzchołkami v0, v2 i v4. Wierzchołek v3 jest początkiem tych krawędzi, a wierzchołki v0, v2 i v4 są ich końcami. Z wierzchołka v3 nie wychodzą żadne krawędzie do wierzchołków v1 i v3. Porównaj to z rysunkiem grafu umieszczonym powyżej. Podobnie jest dla kolumn. Weźmy na przykład kolumnę nr 1, która odpowiada wierzchołkowi v1:
W kolumnie mamy wartość 1 w wierszach o numerach 0, 2 i 4. Znaczy to, że wierzchołek v1 jest końcem krawędzi wychodzących z wierzchołków v0, v2 i v4. Do wierzchołka v1 nie dochodzą krawędzie z wierzchołków v1 i v3.
Aby sprawdzić, czy w grafie dane dwa wierzchołki vi i vj są połączone krawędzią, sprawdzamy, czy komórka A[i,j] zawiera wartość 1. Jeśli tak, to dana krawędź istnieje. Zwróć uwagę, że operację tę można wykonać w czasie stałym, zatem dla macierzy sąsiedztwa sprawdzenie połączenia wierzchołków krawędzią ma klasę złożoności obliczeniowej równą O(1). Wadą jest klasa zajętość pamięci równa O(n2), gdzie n oznacza liczbę wierzchołków w grafie. Z drugiej strony komórki macierzy mogą być pojedynczymi bitami.
Z macierzy sąsiedztwa można odczytać wiele pożytecznych informacje. Oto niektóre z nich:
Dane do ćwiczenia
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Listy sąsiedztwa
Do reprezentacji grafu wykorzystujemy tablicę n elementową A,
gdzie n oznacza liczbę wierzchołków. Każdy element tej tablicy
jest listą. Lista reprezentuje wierzchołek startowy. Na liście są
przechowywane numery wierzchołków końcowych, czyli sąsiadów wierzchołka
startowego, z którymi jest on połączony krawędzią. Tablica ta nosi nazwę
list sąsiedztwa (ang. adjacency lists).
Przykład:
W przypadku grafu nieskierowanego listy są dłuższe, ponieważ muszą odzwierciedlać krawędzie biegnące w obu kierunkach. Przykład:
Listy sąsiedztwa są efektywnym pamięciowo sposobem reprezentacji grafu w pamięci komputera, ponieważ zajmują pamięć rzędu O(m), gdzie m oznacza liczbę krawędzi grafu. Listy sąsiedztwa pozwalają w prosty sposób reprezentować pętle oraz krawędzie wielokrotne, co sprawia, że są bardzo chętnie stosowane w algorytmach grafowych. Oto kilka podstawowych operacji na listach sąsiedztwa:
Dane do ćwiczenia
|
I Liceum Ogólnokształcące |
Pytania proszę przesyłać na adres email: i-lo@eduinf.waw.pl
W artykułach serwisu są używane cookies. Jeśli nie chcesz ich otrzymywać,
zablokuj je w swojej przeglądarce.
Informacje dodatkowe