TILASTOTIEDE DATAN PROSESSOINNISSA

GOMOS:in datan prosessoinnissa käytetään myös monia tilastollisia menetelmiä. Tässä on esitelty prosessoinnin vaiheita, joissa niitä hyödynnetään.

Kohina

GOMOS:in mittausta häiritsevät erilaiset tekijät, kuten instrumentin itsensä aiheuttama ns. musta virta. Kaikkia näitä häiriötekijöitä kutsutaan kohinaksi. Kohinaa on kaikki se, joka ei ole haluttua signaalia. Mitä enemmän fotoneja saapuu detektorille, sitä enemmän on kohinaakin. Kohina aiheuttaa vääristymää mittaustuloksiin ja sen takia se pitäisi osata erotella saadusta signaalista. Kohinan aiheuttama virhe huomioidaan jo datan prosessoinnin aikaisessa vaiheessa instrumenttikorjauksissa (ks. kaavio). Myös auringon valo häiritsee mittausta, mutta sitä ei kutsuta kohinaksi. Auringon valon vaikutus huomioidaan taustasignaalin erotteluvaiheessa.

Kohina on Poisson-jakautunutta, mutta sitä approksimoidaan normaalijakaumalla.

Poisson-jakauma

Olkoon satunnaismuuttuja X binomijakautunut parametrein (n,p).

(binomitodennäköisyys: suoritetaan toistokoe, jossa toistot ovat riippumattomia toisistaan. n=toistojen lukumäärä, p=tapahtuman A todennäköisyys yhdellä toistolla ja todennäköisyys, että A tapahtuu n toistossa k kertaa on Binomitodennäköisyys).

Jos binomijakaumassa n:n (toistojen) annetaan kasvaa rajatta siten, että np = lambda pysyy vakiona, lähenevät pistetodennäköisyydet raja-arvoa:

Raja-arvo, (k = 0, 1, 2, ...)

Nämä rajatodennäköisyydet muodostavat diskreetin jakauman, ns. Poisson-jakauman, X ~ Poisson(lambda)

Poisson-jakauma on diskreetti jakauma, jonka pistetodennäköisyys satunnaismuuttujalle X on

Pistetodennäköisyys (k=0,1,2,,...) ja odotusarvo E(X)= lambda = np.

(Laininen 1985)

Poisson-jakauma sopii harvinaisen tapahtuman esiintymiskertojen lukumäärän jakaumaksi suuressa populaatiossa.



Pienimmän neliösumman suoran sovitus

Kun erilaisia matemaattisia malleja (kuten Beerin laki) eri ilmiöiden tarkasteluun kehitetään, käytetään monia tilastollisia menetelmiä. Eräs näistä tilastollisista menetelmistä on pienimmän neliösumman suoran sovittaminen.

Esim: Meillä on joukko mittaustuloksia y (y=y1, y2, ...y5 ). Tunnemme muuttujan x (x=x1, x2, ...x5) ja tiedämme x:n ja y:n riippuvuudeksi seuraavan: y=ax+b. Haluamme selvittää a:n ja b:n. Merkitään mittauspisteet (5 kpl) koordinaatistoon:

Mittauspisteet

Havaitsemme, että muuttujien x ja y välillä vallitsee positiivinen korrelaatio. Pisteparveen on mahdollista sovittaa suora, jota voidaan käyttää lineaarisena ennustemallina eli ns. regressiosuorana.

Regressiosuora

Merkitään havaintoarvojen ja ennusteiden välisiä eroja (jäännöksiä) :llä. Jäännös lasketaan siis vähentämällä havaintoarvosta ennustearvo: yi-gi.

Ennustesuora sovitetaan yleensä siten, että jäännöksien keskiarvo on nolla ja keskihajonta mahdollisimman pieni.

Jäännökset

Pienimmän neliösumman suoralle y = bx+a voidaan laskea kulmakerroin b ja vakiotermi a seuraavilla kaavoilla:

kulmakerroin b ja vakiotermi a.



Virhearviointia

Mittaustuloksiin täytyy aina suhtautua kriittisesti. Virhearviointi on erittäin tärkeä osa mitä tahansa mittaamisia. GOMOS:in mittaustuloksista lasketaan esimerkiksi keskiarvoja keskihajontoja. Spektraali-inversiossa laskettuja viivatiheyksiä verrataan toisiin mittauksiin, samoin vertikaali-inversiossa saatuja tiheyksiä verrataan toisiinsa ja muihin aikaisemmin saatuihin tiheyksiin.

Esim: Tarkastellaan otsonin määrää korkeudella 30 km. Erään tähden mittauksesta on saatu määräksi X1, toisen tähden mittauksella X2 ja mittauksia on yhteensä n kappaletta.

a) Saaduista mittaustuloksista lasketaan keskiarvo seuraavalla tavalla: Keskiarvo. Eli lisätään saadut arvot yhteen ja jaetaan havaintoarvojen lukumäärällä. Alaindeksi mean on englantia ja tarkoittaa suomeksi keskiarvoa.

b) Mittaustulosten keskihajonta lasketaan seuraavalla tavalla: Keskihajonta. Eli lasketaan jokaisen havaintoarvon poikkeama keskiarvosta ja korotetaan se toiseen, sen jälkeen lisätään yhteen saadut neliöt ja jaetaan havaintoarvojen lukumäärällä. Saatu välitulos, eli keskihajonnan neliö on varianssi. Lopuksi otetaan vielä koko lausekkeesta neliöjuuri. Alaindeksi std tulee englannin kielen sanoista strandard deviation, joka tarkoittaa keskihajontaa.

c) Jos halutaan laskea perusjoukon keskiarvo sopivan otoksen avulla, paras approksimaatio saadaan ottamalla kertoimen 1/n sijaan käyttöön kerroin 1/(n-1):

Otoksen keskihajonta



© Ilmatieteen laitos