Chapter 14 first version

This commit is contained in:
Antti H S Laaksonen 2017-01-07 23:31:41 +02:00
parent a0f2d60b2b
commit f1011ab0f6
1 changed files with 199 additions and 209 deletions

View File

@ -1,16 +1,16 @@
\chapter{Puiden käsittely} \chapter{Tree algorithms}
\index{puu@puu} \index{tree}
\key{Puu} on yhtenäinen, syklitön verkko, A \key{tree} is a connected, acyclic graph
jossa on $n$ solmua ja $n-1$ kaarta. that contains $n$ nodes and $n-1$ edges.
Jos puusta poistaa yhden kaaren, se ei ole enää yhtenäinen, Removing any edge from a tree divides it
ja jos puuhun lisää yhden kaaren, se ei ole enää syklitön. into two components,
Puussa pätee myös aina, että and adding any edge to a tree creates a cycle.
jokaisen kahden puun solmun välillä on yksikäsitteinen polku. Moreover, there is always a unique path between any
two nodes in a tree.
Esimerkiksi seuraavassa puussa on 7 solmua ja 6 kaarta:
For example, the following tree contains 7 nodes and 6 edges:
\begin{center} \begin{center}
\begin{tikzpicture}[scale=0.9] \begin{tikzpicture}[scale=0.9]
\node[draw, circle] (1) at (0,3) {$1$}; \node[draw, circle] (1) at (0,3) {$1$};
@ -29,21 +29,21 @@ Esimerkiksi seuraavassa puussa on 7 solmua ja 6 kaarta:
\end{tikzpicture} \end{tikzpicture}
\end{center} \end{center}
\index{lehti@lehti} \index{leaf}
Puun \key{lehdet} ovat solmut, The \key{leaves} of a tree are nodes
joiden aste on 1 eli joista lähtee vain yksi kaari. with degree 1, i.e., with only one neighbor.
Esimerkiksi yllä olevan puun lehdet ovat For example, the leaves in the above tree
solmut 3, 5, 6 ja 7. are nodes 3, 5, 6 and 7.
\index{juuri@juuri} \index{root}
\index{juurellinen puu@juurellinen puu} \index{rooted tree}
Jos puu on \key{juurellinen}, yksi solmuista In a \key{rooted} tree, one of the nodes
on puun \key{juuri}, is chosen to be a \key{root}, and all other nodes are
jonka alapuolelle muut solmut asettuvat. placed underneath the root.
Esimerkiksi jos yllä olevassa puussa valitaan For example, in the following tree,
juureksi solmu 1, solmut asettuvat seuraavaan järjestykseen: node 1 is the root of the tree.
\begin{center} \begin{center}
\begin{tikzpicture}[scale=0.9] \begin{tikzpicture}[scale=0.9]
@ -63,84 +63,82 @@ juureksi solmu 1, solmut asettuvat seuraavaan järjestykseen:
\end{tikzpicture} \end{tikzpicture}
\end{center} \end{center}
\index{lapsi@lapsi} \index{child}
\index{vanhempi@vanhempi} \index{parent}
Juurellisessa puussa solmun \key{lapset} In a rooted tree, the \key{childern} of a node
ovat sen alemman tason naapurit are its lower neighbors, and the \key{parent} of a node
ja solmun \key{vanhempi} is its upper neighbor.
on sen ylemmän tason naapuri. Each node has exactly one parent,
Jokaisella solmulla on tasan yksi vanhempi, except that the root doesn't have a parent.
paitsi juurella ei ole vanhempaa. For example, in the above tree,
Esimerkiksi yllä olevassa puussa solmun 4 the childern of node 4 are nodes 3 and 7,
lapset ovat solmut 3 ja 7 ja solmun 4 vanhempi on solmu 1. and the parent is node 1.
\index{alipuu@alipuu} \index{subtree}
Juurellisen puun rakenne on \emph{rekursiivinen}: The structure of a rooted tree is \emph{recursive}:
jokaisesta puun solmusta alkaa \key{alipuu}, each node in the tree is the root of a \key{subtree}
jonka juurena on solmu itse ja johon kuuluvat that contains the node itself and all other nodes
kaikki solmut, joihin solmusta pääsee kulkemalla alaspäin puussa. that can be reached by travelling downwards in the tree.
Esimerkiksi solmun 4 alipuussa For example, in the above tree, the subtree of node 4
ovat solmut 4, 3 ja 7. contains nodes 4, 3 and 7.
\section{Puun läpikäynti} \section{Tree search}
Puun läpikäyntiin voi käyttää syvyyshakua ja Depth-first search and breadth-first search
leveyshakua samaan can be used for going through the nodes in a tree.
tapaan kuin yleisen verkon läpikäyntiin. However, the search is easier to implement than
Erona on kuitenkin, että puussa ei ole silmukoita, for a general graph, because
minkä ansiosta ei tarvitse huolehtia siitä, there are no cycles in the tree, and it is not
että läpikäynti päätyisi tiettyyn possible that the search would visit a node several times.
solmuun monesta eri suunnasta.
Tavallisin menetelmä puun läpikäyntiin on Often, we start a depth-first search from a chosen
valita tietty solmu juureksi ja aloittaa root node.
siitä syvyyshaku. The following recursive function implements it:
Seuraava rekursiivinen funktio toteuttaa sen:
\begin{lstlisting} \begin{lstlisting}
void haku(int s, int e) { void dfs(int s, int e) {
// solmun s käsittely tähän // process node s
for (auto u : v[s]) { for (auto u : v[s]) {
if (u != e) haku(u, s); if (u != e) dfs(u, s);
} }
} }
\end{lstlisting} \end{lstlisting}
Funktion parametrit ovat käsiteltävä solmu $s$ The function parameters are the current node $s$
sekä edellinen käsitelty solmu $e$. and the previous node $e$.
Parametrin $e$ ideana on varmistaa, että The idea of the parameter $e$ is to ensure
läpikäynti etenee vain alaspäin puussa that the search only proceeds downwards in the tree
sellaisiin solmuihin, joita ei ole vielä käsitelty. towards nodes that have not been visited yet.
Seuraava kutsu käy läpi puun aloittaen juuresta $x$: The following function call starts the search
at node $x$:
\begin{lstlisting} \begin{lstlisting}
haku(x, 0); dfs(x, 0);
\end{lstlisting} \end{lstlisting}
Ensimmäisessä kutsussa $e=0$, koska läpikäynti In the first call $e=0$ because there is no
saa edetä juuresta kaikkiin suuntiin alaspäin. previous node, and it is allowed
to proceed to any direction in the tree.
\subsubsection{Dynaaminen ohjelmointi} \subsubsection{Dynamic programming}
Puun läpikäyntiin voi myös yhdistää dynaamista We can also use dynamic programming to calculate
ohjelmointia ja laskea sen avulla jotakin tietoa puusta. some information from the tree during the search.
Dynaamisen ohjelmoinnin avulla voi esimerkiksi Using dynamic programming, we can, for example,
laskea ajassa $O(n)$ jokaiselle solmulle, calculate in $O(n)$ time for each node the
montako solmua sen alipuussa number of nodes in its subtree,
on tai kuinka pitkä on pisin solmusta or the length of the longest path downwards
alaspäin jatkuva polku puussa. that begins at the node.
Lasketaan esimerkiksi jokaiselle solmulle $s$ As an example, let's calculate for each node $s$
sen alipuun solmujen määrä $\texttt{c}[s]$. a value $\texttt{c}[s]$: the number of nodes in its subtree.
Solmun alipuuhun kuuluvat solmu itse The subtree contains the node itself and
sekä kaikki sen lasten alipuut. all nodes in the subtrees of its children.
Niinpä solmun alipuun solmujen määrä on Thus, we can calculate the number of nodes
yhden suurempi kuin summa lasten recursively using the following code:
alipuiden solmujen määristä.
Laskennan voi toteuttaa seuraavasti:
\begin{lstlisting} \begin{lstlisting}
void haku(int s, int e) { void haku(int s, int e) {
@ -153,13 +151,14 @@ void haku(int s, int e) {
} }
\end{lstlisting} \end{lstlisting}
\section{Läpimitta} \section{Diameter}
\index{lzpimitta@läpimitta} \index{diameter}
Puun \key{läpimitta} on pisin polku The \key{diameter} of a tree
kahden puussa olevan solmun välillä. is the length of the longest path
Esimerkiksi puussa between two nodes in the tree.
For example, in the tree
\begin{center} \begin{center}
\begin{tikzpicture}[scale=0.9] \begin{tikzpicture}[scale=0.9]
\node[draw, circle] (1) at (0,3) {$1$}; \node[draw, circle] (1) at (0,3) {$1$};
@ -177,33 +176,28 @@ Esimerkiksi puussa
\path[draw,thick,-] (3) -- (7); \path[draw,thick,-] (3) -- (7);
\end{tikzpicture} \end{tikzpicture}
\end{center} \end{center}
läpimitta on 4, jota vastaa kaksi polkua: the diameter is 4, and it corresponds to two paths:
solmujen 3 ja 6 välinen polku sekä the path between nodes 3 and 6,
solmujen 7 ja 6 välinen polku. and the path between nodes 7 and 6.
Käymme seuraavaksi läpi kaksi tehokasta Next we will learn two efficient algorithms
algoritmia puun läpimitan laskeminen. for calculating the diameter of a tree.
Molemmat algoritmit laskevat läpimitan ajassa Both algorithms calculate the diameter in $O(n)$ time.
$O(n)$. The first algorithm is based on dynamic programming,
Ensimmäinen algoritmi perustuu dynaamiseen and the second algorithm uses two depth-first searches
ohjelmointiin, ja toinen algoritmi to calculate the diameter.
laskee läpimitan kahden syvyyshaun avulla.
\subsubsection{Algoritmi 1} \subsubsection{Algorithm 1}
Algoritmin alussa First, one of the nodes is chosen to be the root.
yksi solmuista valitaan puun juureksi. After this, the algorithm calculates for each node
Tämän jälkeen algoritmi laskee the length of the longest path that begins at some leaf,
jokaiseen solmuun, ascends to the node and then descends to another leaf.
kuinka pitkä on pisin polku, The length of the
joka alkaa jostakin lehdestä, longest such path equals the diameter of the tree.
nousee kyseiseen solmuun asti
ja laskeutuu toiseen lehteen.
Pisin tällainen polku vastaa puun läpimittaa.
Esimerkissä pisin polku alkaa lehdestä 7, In the example case, the longest path begins at node 7,
nousee solmuun 1 asti ja laskeutuu ascends to node 1, and then descends to node 6:
sitten alas lehteen 6:
\begin{center} \begin{center}
\begin{tikzpicture}[scale=0.9] \begin{tikzpicture}[scale=0.9]
\node[draw, circle] (1) at (0,3) {$1$}; \node[draw, circle] (1) at (0,3) {$1$};
@ -227,32 +221,32 @@ sitten alas lehteen 6:
\end{tikzpicture} \end{tikzpicture}
\end{center} \end{center}
Algoritmi laskee ensin dynaamisella ohjelmoinnilla The algorithm first calculates using dynamic programming
jokaiselle solmulle, kuinka pitkä on pisin polku, for each node the length of the longest path
joka lähtee solmusta alaspäin. that goes downwards from the node.
Esimerkiksi yllä olevassa puussa pisin polku For example, in the above tree,
solmusta 1 alaspäin on pituudeltaan 2 the longest path from node 1 downwards has length 2
(vaihtoehdot $1 \rightarrow 4 \rightarrow 3$, (the path can be $1 \rightarrow 4 \rightarrow 3$,
$1 \rightarrow 4 \rightarrow 7$ ja $1 \rightarrow 2 \rightarrow 6$). $1 \rightarrow 4 \rightarrow 7$ or $1 \rightarrow 2 \rightarrow 6$).
Tämän jälkeen algoritmi laskee kullekin solmulle, After this, the algorithm calculates for each node
kuinka pitkä on pisin polku, jossa solmu on käännekohtana. the length of the longest path where the node
Pisin tällainen polku syntyy valitsemalla kaksi lasta, is the turning point of the path.
joista lähtee alaspäin mahdollisimman pitkä polku. The longest such path can be found by selecting
Esimerkiksi yllä olevassa puussa solmun 1 lapsista valitaan solmut 2 ja 4. two children with longest paths downwards.
For example, in the above graph,
nodes 2 and 4 are chosen for node 1.
\subsubsection{Algoritmi 2} \subsubsection{Algorithm 2}
Toinen tehokas tapa laskea puun läpimitta Another efficient way to calculate the diameter
perustuu kahteen syvyyshakuun. of a tree is based on two depth-first searches.
Ensin valitaan mikä tahansa solmu $a$ puusta First, we choose an arbitrary node $a$ in the tree
ja etsitään siitä kaukaisin solmu $b$ and find a node $b$ with maximum distance to $a$.
syvyyshaulla. Then, we find a node $c$ with maximum distance to $b$.
Tämän jälkeen etsitään $b$:stä kaukaisin The diameter is the distance between nodes $b$ and $c$.
solmu $c$ syvyyshaulla.
Puun läpimitta on etäisyys $b$:n ja $c$:n välillä.
Esimerkissä $a$, $b$ ja $c$ voisivat olla: In the example case, $a$, $b$ and $c$ could be:
\begin{center} \begin{center}
\begin{tikzpicture}[scale=0.9] \begin{tikzpicture}[scale=0.9]
\node[draw, circle] (1) at (0,3) {$1$}; \node[draw, circle] (1) at (0,3) {$1$};
@ -279,12 +273,12 @@ Esimerkissä $a$, $b$ ja $c$ voisivat olla:
\end{tikzpicture} \end{tikzpicture}
\end{center} \end{center}
Menetelmä on tyylikäs, mutta miksi se toimii? This is an elegant method, but why does it work?
Tässä auttaa tarkastella puuta niin, It helps to draw the tree differently so that
että puun läpimittaa vastaava polku on the path that corresponds to the diameter
levitetty vaakatasoon ja muut puun osat is horizontal, and all other
riippuvat siitä alaspäin: nodes hang from it:
\begin{center} \begin{center}
\begin{tikzpicture}[scale=0.9] \begin{tikzpicture}[scale=0.9]
\node[draw, circle] (1) at (2,1) {$1$}; \node[draw, circle] (1) at (2,1) {$1$};
@ -312,29 +306,25 @@ riippuvat siitä alaspäin:
\end{tikzpicture} \end{tikzpicture}
\end{center} \end{center}
Solmu $x$ on kohta, Node $x$ indicates the place where the path
jossa polku solmusta $a$ liittyy from node $a$ joins the path that corresponds
läpimittaa vastaavaan polkuun. to the diameter.
Kaukaisin solmu $a$:sta The farthest node from $a$
on solmu $b$, solmu $c$ is node $b$, node $c$ or some other node
tai jokin muu solmu, joka that is at least as far from node $x$.
on ainakin yhtä kaukana solmusta $x$. Thus, this node can always be chosen for
Niinpä tämä solmu on aina sopiva a starting node of a path that corresponds to the diameter.
valinta läpimittaa vastaavan polun
toiseksi päätesolmuksi.
\section{Solmujen etäisyydet} \section{Distances between nodes}
Vaikeampi tehtävä on laskea A more difficult problem is to calculate
jokaiselle puun solmulle for each node in the tree and for each direction,
jokaiseen suuntaan, mikä on suurin the maximum distance to a node in that direction.
etäisyys johonkin kyseisessä suunnassa It turns out that this can be calculated in
olevaan solmuun. $O(n)$ time as well using dynamic programming.
Osoittautuu, että tämäkin tehtävä ratkeaa
ajassa $O(n)$ dynaamisella ohjelmoinnilla.
\begin{samepage} \begin{samepage}
Esimerkkipuussa etäisyydet ovat: In the example case, the distances are as follows:
\begin{center} \begin{center}
\begin{tikzpicture}[scale=0.9] \begin{tikzpicture}[scale=0.9]
\node[draw, circle] (1) at (0,3) {$1$}; \node[draw, circle] (1) at (0,3) {$1$};
@ -365,16 +355,16 @@ Esimerkkipuussa etäisyydet ovat:
\end{tikzpicture} \end{tikzpicture}
\end{center} \end{center}
\end{samepage} \end{samepage}
Esimerkiksi solmussa 4 For example, the furthest node from node 4
kaukaisin solmu ylöspäin mentäessä upwards is node 6, and the distance to this
on solmu 6, johon etäisyys on 3 käyttäen node is 3 using the path
polkua $4 \rightarrow 1 \rightarrow 2 \rightarrow 6$. $4 \rightarrow 1 \rightarrow 2 \rightarrow 6$.
\begin{samepage} \begin{samepage}
Tässäkin tehtävässä hyvä lähtökohta on Also in this problem, a good starting point
valita jokin solmu puun juureksi, is to root the tree.
jolloin kaikki etäisyydet alaspäin After this, all distances downwards can
saa laskettua dynaamisella ohjelmoinnilla: be calculated using dynamic programming:
\begin{center} \begin{center}
\begin{tikzpicture}[scale=0.9] \begin{tikzpicture}[scale=0.9]
\node[draw, circle] (1) at (0,3) {$1$}; \node[draw, circle] (1) at (0,3) {$1$};
@ -403,16 +393,14 @@ saa laskettua dynaamisella ohjelmoinnilla:
\end{center} \end{center}
\end{samepage} \end{samepage}
Jäljelle jäävä tehtävä on laskea etäisyydet ylöspäin. The remaining task is to calculate the distances upwards.
Tämä onnistuu tekemällä puuhun toinen läpikäynti, This can be done by going through the nodes once again
joka pitää mukana tietoa, and keeping track of the largest distance from the parent
mikä on suurin etäisyys solmun vanhemmasta of the current node to some other node in another direction.
johonkin toisessa suunnassa olevaan solmuun.
Esimerkiksi solmun 2 For example, the distance from node 2 upwards
suurin etäisyys ylöspäin on yhtä suurempi is one larger than the distance from node 1
kuin solmun 1 suurin etäisyys downwards in some other direction than node 2:
johonkin muuhun suuntaan kuin solmuun 2:
\begin{center} \begin{center}
\begin{tikzpicture}[scale=0.9] \begin{tikzpicture}[scale=0.9]
\node[draw, circle] (1) at (0,3) {$1$}; \node[draw, circle] (1) at (0,3) {$1$};
@ -435,8 +423,8 @@ johonkin muuhun suuntaan kuin solmuun 2:
\end{tikzpicture} \end{tikzpicture}
\end{center} \end{center}
Lopputuloksena on etäisyydet kaikista solmuista Finally, we can calculate the distances for all nodes
kaikkiin suuntiin: and all directions:
\begin{center} \begin{center}
\begin{tikzpicture}[scale=0.9] \begin{tikzpicture}[scale=0.9]
\node[draw, circle] (1) at (0,3) {$1$}; \node[draw, circle] (1) at (0,3) {$1$};
@ -471,23 +459,20 @@ kaikkiin suuntiin:
\node[color=red] at (0.2,1.6) {$3$}; \node[color=red] at (0.2,1.6) {$3$};
\end{tikzpicture} \end{tikzpicture}
\end{center} \end{center}
%
% Kummankin läpikäynnin aikavaativuus on $O(n)$,
% joten algoritmin kokonais\-aikavaativuus on $O(n)$.
\section{Binääripuut} \section{Binary trees}
\index{binxxripuu@binääripuu} \index{binary tree}
\begin{samepage} \begin{samepage}
\key{Binääripuu} on juurellinen puu, A \key{binary tree} is a rooted tree
jonka jokaisella solmulla on vasen ja oikea alipuu. where each node has a left subtree
On mahdollista, että alipuu on tyhjä, and a right subtree.
jolloin puu ei jatku siitä pidemmälle alaspäin. It is possible that a subtree of a node is empty.
Binääripuun jokaisella solmulla on 0, 1 tai 2 lasta. Thus, every node in a binary tree has
0, 1 or 2 children.
Esimerkiksi seuraava puu on binääripuu:
For example, the following tree is a binary tree:
\begin{center} \begin{center}
\begin{tikzpicture}[scale=0.9] \begin{tikzpicture}[scale=0.9]
\node[draw, circle] (1) at (0,0) {$1$}; \node[draw, circle] (1) at (0,0) {$1$};
@ -508,37 +493,42 @@ Esimerkiksi seuraava puu on binääripuu:
\end{center} \end{center}
\end{samepage} \end{samepage}
Binääripuun solmuilla on kolme luontevaa järjestystä, \index{pre-order}
jotka syntyvät rekursiivisesta läpikäynnistä: \index{in-order}
\index{post-order}
\index{esijxrjestys@esijärjestys} The nodes in a binary tree have three natural
\index{sisxjxrjestys@sisäjärjestys} orders that correspond to different ways to
\index{jxlkijxrjestys@jälkijärjestys} recursively traverse the nodes:
\begin{itemize} \begin{itemize}
\item \key{esijärjestys}: juuri, vasen alipuu, oikea alipuu \item \key{pre-order}: first process the root,
\item \key{sisäjärjestys}: vasen alipuu, juuri, oikea alipuu then traverse the left subtree, then traverse the right subtree
\item \key{jälkijärjestys}: vasen alipuu, oikea alipuu, juuri \item \key{in-order}: first traverse the left subtree,
then process the root, then traverse the right subtree
\item \key{post-order}: first traverse the left subtree,
then traverse the right subtree, then process the root
\end{itemize} \end{itemize}
Esimerkissä kuvatun puun esijärjestys on For the above tree, the nodes in
pre-order are
$[1,2,4,5,6,3,7]$, $[1,2,4,5,6,3,7]$,
sisäjärjestys on $[4,2,6,5,1,3,7]$ in in-order $[4,2,6,5,1,3,7]$
ja jälkijärjestys on $[4,6,5,2,7,3,1]$. and in post-order $[4,6,5,2,7,3,1]$.
Osoittautuu, että tietämällä puun esijärjestyksen If we know the pre-order and the in-order
ja sisäjärjestyksen voi päätellä puun koko rakenteen. of a tree, we can find out the exact structure of the tree.
Esimerkiksi yllä oleva puu on ainoa mahdollinen For example, the tree above is the only possible tree
puu, jossa esijärjestys on with pre-order $[1,2,4,5,6,3,7]$ and
$[1,2,4,5,6,3,7]$ ja sisäjärjestys on $[4,2,6,5,1,3,7]$. in-order $[4,2,6,5,1,3,7]$.
Vastaavasti myös jälkijärjestys ja sisäjärjestys Correspondingly, the post-order and the in-order
määrittävät puun rakenteen. also determine the structure of a tree.
Tilanne on toinen, jos tiedossa on vain However, the situation is different if we only know
esijärjestys ja jälkijärjestys. the pre-order and the post-order of a tree.
Nämä järjestykset eivät In this case, there may be more than one tree
kuvaa välttämättä puuta yksikäsitteisesti. that match the orders.
Esimerkiksi molemmissa puissa For example, in both of the trees
\begin{center} \begin{center}
\begin{tikzpicture}[scale=0.9] \begin{tikzpicture}[scale=0.9]
\node[draw, circle] (1) at (0,0) {$1$}; \node[draw, circle] (1) at (0,0) {$1$};
@ -550,6 +540,6 @@ Esimerkiksi molemmissa puissa
\path[draw,thick,-] (1b) -- (2b); \path[draw,thick,-] (1b) -- (2b);
\end{tikzpicture} \end{tikzpicture}
\end{center} \end{center}
esijärjestys on $(1,2)$ ja jälkijärjestys on $(2,1)$, the pre-order is $[1,2]$ and the post-order is $[2,1]$
mutta siitä huolimatta puiden rakenteet eivät ole samat. but the trees have different structures.