diff --git a/luku24.tex b/luku24.tex index b0e66b8..ca5629c 100644 --- a/luku24.tex +++ b/luku24.tex @@ -205,57 +205,61 @@ are independent. Hence the event happens with probability \[P(A \cap B)=P(A)P(B)=1/4 \cdot 1/13 = 1/52.\] -\section{Satunnaismuuttuja} +\section{Random variable} -\index{satunnaismuuttuja@satunnaismuuttuja} +\index{random variable} -\key{Satunnaismuuttuja} on arvo, joka syntyy satunnaisen -prosessin tuloksena. -Satunnaismuuttujaa merkitään yleensä -suurella kirjaimella. -Esimerkiksi kahden nopan heitossa yksi mahdollinen -satunnaismuuttuja on -\[X=\textrm{''silmälukujen summa''}.\] -Esimerkiksi jos heitot ovat $(4,6)$, -niin $X$ saa arvon 10. +A \key{random variable} is a value that is generated +by a random process. +For example, when throwing two dice, +a possible random variable is +\[X=\textrm{''the sum of the results''}.\] +For example, if the results are $(4,6)$, +then the value of $X$ is 10. -Merkintä $P(X=x)$ tarkoittaa todennäköisyyttä, -että satunnaismuuttujan $X$ arvo on $x$. -Edellisessä esimerkissä $P(X=10)=3/36$, -koska erilaisia heittotapoja on 36 -ja niistä summan 10 tuottavat heitot -$(4,6)$, $(5,5)$ ja $(6,4)$. +We denote $P(X=x)$ the probability that +the value of a random variable $X$ is $x$. +In the previous example, $P(X=10)=3/36$, +because the total number of results is 36, +and the possible ways to obtain the sum 10 are +$(4,6)$, $(5,5)$ and $(6,4)$. -\subsubsection{Odotusarvo} +\subsubsection{Expected value} -\index{odotusarvo@odotusarvo} +\index{expected value} -\key{Odotusarvo} $E[X]$ kertoo, mikä satunnaismuuttujan $X$ -arvo on keskimääräisessä tilanteessa. -Odotusarvo lasketaan summana +The \key{expected value} $E[X]$ indicates the +average value of a random variable $X$. +The expected value can be calculated as the sum \[\sum_x P(X=x)x,\] -missä $x$ saa kaikki mahdolliset satunnaismuuttujan arvot. +where $x$ goes through all possible results +for $X$. -Esimerkiksi nopan heitossa silmäluvun odotusarvo on +For example, when throwing a dice, +the expected value is \[1/6 \cdot 1 + 1/6 \cdot 2 + 1/6 \cdot 3 + 1/6 \cdot 4 + 1/6 \cdot 5 + 1/6 \cdot 6 = 7/2.\] -Usein hyödyllinen odotusarvon ominaisuus on \key{lineaarisuus}. -Sen ansiosta summa $E[X_1+X_2+\cdots+X_n]$ voidaan laskea $E[X_1]+E[X_2]+\cdots+E[X_n]$. -Kaava pätee myös silloin, kun satunnaismuuttujat riippuvat toisistaan. +A useful property of expected values is \key{linearity}. +It means that the sum +$E[X_1+X_2+\cdots+X_n]$ +always equals the sum +$E[X_1]+E[X_2]+\cdots+E[X_n]$. +This formula holds even if random variables +depend on each other. -Esimerkiksi kahden nopan heitossa silmälukujen summan odotusarvo on +For example, when throwing two dice, +the expected value of their sum is \[E[X_1+X_2]=E[X_1]+E[X_2]=7/2+7/2=7.\] -Tarkastellaan sitten tehtävää, -jossa $n$ laatikkoon sijoitetaan -satunnaisesti $n$ palloa -ja laskettavana on odotusarvo, -montako laatikkoa jää tyhjäksi. -Kullakin pallolla on yhtä suuri todennäköisyys -päätyä mihin tahansa laatikkoon. -Esimerkiksi jos $n=2$, niin -vaihtoehdot ovat seuraavat: +Let's now consider a problem where +$n$ balls are randomly placed in $n$ boxes, +and our task is to calculate the expected +number of empty boxes. +Each ball has an equal probability to +be placed in any of the boxes. +For example, if $n=2$, the possibilities +are as follows: \begin{center} \begin{tikzpicture} \draw (0,0) rectangle (1,1); @@ -277,28 +281,27 @@ vaihtoehdot ovat seuraavat: \draw[fill=red] (10.95,0.2) circle (0.1); \end{tikzpicture} \end{center} -Tässä tapauksessa odotusarvo -tyhjien laatikoiden määrälle on +In this case, the expected number of +empty boxes is \[\frac{0+0+1+1}{4} = \frac{1}{2}.\] -Yleisessä tapauksessa -todennäköisyys, että yksittäinen hattu on tyhjä, -on +In the general case, the probability that a +single box is empty is \[\Big(\frac{n-1}{n}\Big)^n,\] -koska mikään pallo ei saa mennä sinne. -Niinpä odotusarvon lineaarisuuden ansiosta tyhjien hattujen -määrän odotusarvo on +because no ball should be placed in it. +Hence, using linearity, the expected number of +empty boxes is \[n \cdot \Big(\frac{n-1}{n}\Big)^n.\] -\subsubsection{Jakaumat} +\subsubsection{Distributions} -\index{jakauma@jakauma} +\index{distribution} -Satunnaismuuttujan \key{jakauma} kertoo, -millä todennäköisyydellä satunnaismuuttuja -saa minkäkin arvon. -Jakauma muodostuu arvoista $P(X=x)$. -Esimerkiksi kahden nopan heitossa -silmälukujen summan jakauma on: +The \key{distribution} of a random variable $X$ +shows the probability for each value that +the random variable may have. +The distribution consists of values $P(X=x)$. +For example, when throwing two dice, +the distribution for their sum is: \begin{center} \small { \begin{tabular}{r|rrrrrrrrrrrrr} @@ -307,53 +310,60 @@ $P(X=x)$ & $1/36$ & $2/36$ & $3/36$ & $4/36$ & $5/36$ & $6/36$ & $5/36$ & $4/36$ \end{tabular} } \end{center} -Tutustumme seuraavaksi muutamaan usein esiintyvään jakaumaan. -\index{tasajakauma@tasajakauma} + +Next, we will discuss three distributions that +often arise in applications. + +\index{uniform distribution} ~\\\\ -\key{Tasajakauman} satunnaismuuttuja -saa arvoja väliltä $a \ldots b$ -ja jokaisen arvon todennäköisyys on sama. -Esimerkiksi yhden nopan heitto tuottaa tasajakauman, -jossa $P(X=x)=1/6$, kun $x=1,2,\ldots,6$. +In a \key{uniform distribution}, +the value of a random variable is +between $a \ldots b$, and the probability +for each value is the same. +For example, throwing a dice generates +a uniform distribution where +$P(X=x)=1/6$ when $x=1,2,\ldots,6$. -Tasajakaumassa $X$:n odotusarvo on +The expected value for $X$ in a uniform distribution is \[E[X] = \frac{a+b}{2}.\] -\index{binomijakauma@binomijakauma} +\index{binomial distribution} ~\\ -\key{Binomijakauma} kuvaa tilannetta, jossa tehdään $n$ -yritystä ja joka yrityksessä onnistumisen -todennäköisyys on $p$. Satunnaismuuttuja $X$ -on onnistuneiden yritysten määrä, -ja arvon $x$ todennäköisyys on +In a \key{binomial distribution}, $n$ attempts +are done +and the probability that a single attempt succeeds +is $p$. +The random variable $X$ counts the number of +successful attempts, +and the probability for a value $x$ is \[P(X=x)=p^x (1-p)^{n-x} {n \choose x},\] -missä $p^x$ kuvaa onnistuneita yrityksiä, -$(1-p)^{n-x}$ kuvaa epäonnistuneita yrityksiä -ja ${n \choose x}$ antaa erilaiset tavat, -miten yritykset sijoittuvat toisiinsa nähden. +where $p^x$ and $(1-p)^{n-x}$ correspond to +successful and unsuccessful attemps, +and ${n \choose x}$ is the number of ways +we can choose the order of the attempts. -Esimerkiksi jos heitetään 10 kertaa noppaa, -todennäköisyys saada tarkalleen 3 kertaa silmäluku 6 -on $(1/6)^3 (5/6)^7 {10 \choose 3}$. +For example, when throwing a dice ten times, +the probability of throwing a six exactly +three times is $(1/6)^3 (5/6)^7 {10 \choose 3}$. -Binomijakaumassa $X$:n odotusarvo on +The expected value for $X$ in a binomial distribution is \[E[X] = pn.\] -\index{geometrinen jakauma@geometrinen jakauma} +\index{geometric distribution} ~\\ -\key{Geometrinen jakauma} kuvaa tilannetta, -jossa onnistumisen todennäköisyys on $p$ -ja yrityksiä tehdään, kunnes tulee ensimmäinen -onnistuminen. Satunnaismuuttuja $X$ on -tarvittavien heittojen määrä, -ja arvon $x$ todennäköisyys on +In a \key{geometric distribution}, +the probability that an attempt succeeds is $p$, +and we do attempts until the first success happens. +The random variable $X$ counts the number +of attempts needed, and the probability for +a value $x$ is \[P(X=x)=(1-p)^{x-1} p,\] -missä $(1-p)^{x-1}$ kuvaa epäonnistuneita yrityksiä ja -$p$ on ensimmäinen onnistunut yritys. +where $(1-p)^{x-1}$ corresponds to unsuccessful attemps +and $p$ corresponds to the first successful attempt. -Esimerkiksi jos heitetään noppaa, -kunnes tulee silmäluku 6, todennäköisyys -heittää tarkalleen 4 kertaa on $(5/6)^3 1/6$. +For example, if we throw a dice until we throw a six, +the probability that the number of throws +is exactly 4 is $(5/6)^3 1/6$. -Geometrisessa jakaumassa $X$:n odotusarvo on +The expected value for $X$ in a geometric distribution is \[E[X]=\frac{1}{p}.\] \section{Markovin ketju}