Jakas reklama 

 

Średnią arytmetyczną n liczb a1,a2,...,an nazywamy liczbę :\frac{a_1 + a_2 + \cdots + a_n}{n}.

Średnia arytmetyczna jest właśnie tym, co w potocznym języku określa się mianem średniej. Można ją również określić jako średnią potęgową rzędu 1.

Na przykład średnią liczb 2, 2, 5 i 7 jest

\frac{2+2+5+7}{4}=4.

Średnia arytmetyczna jest jedną z najbardziej intuicyjnych miar oceny populacji, stosowanych często w codziennym życiu – przykładem może być średni wzrost w grupie osób mających wzrost 174, 178, 182 i 185 cm. Średni wzrost wynosi 179,75 cm.

\frac{174+178+182+185}{4}=179,75

W podobny sposób można mówić o średniej płacy w danej firmie, średniej cenie pomarańczy na targowiskach w lipcu 2004 roku czy średniej ocen studenta w roku akademickim. Czasami jednak, w próbach o rozkładzie dalekim od normalnego z dużym udziałem obserwacji odstających lepszą miarą jest mediana.

Średnia arytmetyczna jest dobrą miarą położenia rozkładu i jednocześnie miarą tendencji centralnej. Jest to miara klasyczna rozkładu, czyli każda zmiana dowolnego elementu badanego zbioru pociąga za sobą zmianę wartości średniej.

Spis treści

edytuj Właściwości statystyczne średniej z próby

edytuj Odchylenie standardowe średniej

Jeśli uśredniamy n nieskorelowanych[1] zmiennych o odchyleniach standardowych \sigma_1,\sigma_2,\dots,\sigma_n, to odchylenie ich średniej arytmetycznej jest równe średniej kwadratowej odchyleń tych zmiennych:

\sigma_{\overline{X}}=\sqrt{\frac{\sigma_1^2+\sigma_2^2+\dots+\sigma_n^2}{n}}

Jeśli zmienne są skorelowane, wówczas odchylenie średniej będzie inne, np. dla dwóch zmiennych X1,X2:

\sigma_{\overline{X}}=\sqrt{\frac{\sigma_1^2+\sigma_2^2+2\rho_{12}\sigma_1\sigma_2}{2}}

gdzie ρ12 to współczynnik korelacji między nimi.

W ogólnym przypadku dla n skorelowanych zmiennych:

\sigma_{\overline{X}}=\sqrt{\frac{\sum\limits_{i=1}^{n}\sum\limits_{j=1}^{n}\rho_{ij}\sigma_i\sigma_j}{n}}=\sqrt{\frac{\sum\limits_{i=1}^{n}\sum\limits_{j=1}^{n}\operatorname{cov}(X_i,X_j)}{n}}

gdzie \operatorname{cov}(X_i,X_j) to kowariancja i-tej i j-tej zmiennej.

edytuj Prawo wielkich liczb

Zobacz więcej w osobnym artykule: prawo wielkich liczb.

Jeśli X jest zmienną losową o skończonej wariancji i wartości oczekiwanej μ, a x_1\dots x_n to prosta próba losowa z tej zmiennej, Wtedy dla dowolnie małej dodatniej liczby \varepsilon:

\lim_{n\to\infty} \operatorname{P}\left\{ \mu-\varepsilon\leq\frac{x_1+\dots+x_n}{n}\leq\mu+\varepsilon\right\} =1

Innymi słowy średnia próbkowa dąży do wartości oczekiwanej w populacji wraz ze wzrostem liczności próby. Prawo wielkich liczb można wzmocnić na dwa sposoby, przedstawione dalej.

edytuj Centralne twierdzenie graniczne

Zobacz więcej w osobnym artykule: centralne twierdzenie graniczne.

Zgodnie z centralnym twierdzeniem granicznym rozkład średniej z n-elementowej próby wraz ze wzrostem n coraz lepiej odpowiada rozkładowi normalnemu o wartości oczekiwanej μ i odchyleniu \sigma/\sqrt{n}, gdzie μ oraz σ to odpowiednio wartość oczekiwana oraz odchylenie standardowe w populacji z której losowana jest próba. Ściślej dla dowolnych liczb rzeczywistych a,b takich, że a < b:

\operatorname{P}\left\{a\leq\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\leq b\right\}\to \operatorname{P}\{a\leq Z\leq  b\}=\Phi(b)-\Phi(a)

gdzie:

Twierdzenie to jest prawdziwe niezależnie od rozkładu w populacji. Właściwość ta jest wykorzystywana w wielu metodach statystycznych i estymatorach. Centralne twierdzenie graniczne jest uogólnieniem prawa wielkich liczb, gdyż opisuje zachowanie całego rozkładu średniej, podczas gdy prawo wielkich liczb opisywało jeden jego parametr (wartość oczekiwaną).

edytuj Właściwości średniej jako estymatora

Średnia arytmetyczna w próbie jest niezależnie od rozkładu estymatorem zgodnym i nieobciążonym wartości oczekiwanej rozkładu, z którego próba była losowana. Jeśli jest to rozkład normalny, to średnia jest również estymatorem efektywnym.

edytuj Ograniczenia

Średnia arytmetyczna jest podatna na obserwacje odstające (czyli w tym przypadku wartości zmiennej, losowane spoza rozkładu, którego wartość oczekiwaną chcemy estymować, np. pomyłki w danych). W przypadku, gdy jest ich dostatecznie dużo, inne średnie, takie jak mediana, czy średnia ucinana mogą dawać lepsze wyniki.

Przypisy

  1. nie muszą być niezależne, wystarcza zerowa wartość współczynnika korelacji Pearsona

edytuj Bibliografia

edytuj Zobacz też


. - . - . - . - . meble pożyczki gotówkowe High School Musical 3 Ostatnia klasa katalog stron altany projektowanie stron poznań dental health London Ulubione linki posadzki kredyt hipotecznyHotels in Berlijn | Berlin | Hotels a Berlín | Germany Hotels | systemy dociepleń