Beräkning av klimatindikatorn nederbörd

Klimatindikatorn nederbörd beräknas med hjälp av data från över 1 300 mätstationer. Från dessa beräknas den genomsnittliga nederbörden för året samt vår, sommar, höst och vinter. I artikeln beskrivs hur detta går till.

En klimatindikator visar förändringar i klimatet, till exempel hur sammanlagd nederbörd varierat över tid. För att beräkna detta behövs långa tidsserier med observationer av bra kvalitet.

Det är också viktigt att ta hänsyn till att de observationer som används, ger en rättvis bild för det område som beskrivs. Jämfört med exempelvis temperatur och lufttryck är nederbörd mer variabel både i tid och rum (vilket man kan bli varse en och annan midsommarafton). Detta medför att det behövs många fler observationer av nederbörd än temperatur eller lufttryck för att ge en representativ bild av nederbörden i Sverige under de senaste 150 åren.

Många stationer för att mäta nederbörd

Mer än 2000 stationer har under någon period observerat nederbörd för SMHI:s (eller dess föregångares) räkning, vilket kan jämföras med cirka 960 stationer som observerat temperatur. Flest stationer för observationer av nederbörd var verksamma samtidigt under 1960-talet då runt 900 stationer var verksamma samtidigt.  Läs mer i artikeln Hur mäts nederbörd?.

SMHI:s stationsnätverk genomgår dock ständiga förändringar: stationer flyttar, läggs ner och nya startar upp. Stationer som sköts av observatörer (manuella stationer) ersätts av stationer där nederbörden mäts med automatiska metoder. Endast sju stationer har fullständiga kontinuerliga mätningar från 1880 till idag.

Behov av att hantera observationer innan en indikator kan presenteras

En klimatindikator som tas fram från direkta observationer skulle vara beroende av var dessa stationer är utplacerade samt vara känslig för om dessa stationer skulle behöva flyttas eller läggas ner i framtiden. För att utnyttja en större del av observationerna som finns tillgängliga krävs en metod för att fylla i eventuella luckor i tidserierna.

En annan faktor som påverkar indikatorns kvalitet är osäkerheter i observationerna i sig. Vind och avdunstning kan göra att de uppmätta värdena är mindre än de faktiska, nederbörd i form av snö medför större osäkerhet och små nederbördsmängder är särskilt svårt att mäta.

Metoder och tekniker för att göra så bra mätningar som möjligt har införts och förbättrats under årens lopp (till exempel vindskydd och tratt eller olja för att förhindra avdunstning). Mycket talar för att tidiga nederbördsobservationer underskattade nederbördsmängderna (Alexandersson, 2003), det är dock svårt att uppskatta hur mycket. Dessutom var troligen granskningen med korrektion eller interpolation av misstänkta eller saknade nederbördsvärden inte lika omfattande som i nutid. Av den anledningen är tiden fram till 1933 gråmarkerad i diagrammet.

Metod för att ta fram klimatindikatorn nederbörd

Metoden som används för att räkna ut klimatindikatorn för nederbörd kallas för "Principalkomponentanalys" (PCA) eller "Empirical Orthogonal Functions" (EOF). Dessa två begrepp används omväxlande i litteraturen men avser i de flesta fall samma metod. PCA är en vanligt förekommande metod för att förenkla stora datamängder och har tidigare använts för att behandla klimatologisk data (Björnsson och Venegas, 1997).

PCA-metoden beskriver ett antal mönster i data varierar över dess dimensioner, exempelvis geografiska mönster över hur data varierar i tid. Några av dessa mönster beskriver en stor del av variationen, medan andra beskriver mindre detaljer i variationen. Tillsammans ger mönstren en fullständig bild av datan. 

Hur nederbördsindikatorn beräknas med PCA

PCA används här för att först beskriva mönster i hur nederbörden i Sverige varierat geografiskt under en kortare "träningsperiod". Observationsdata hämtas från de 1 356 stationer som under träningsperioden har data i minst 120 månader. Då få av dessa har fullständiga tidserier under träningsperioden interpoleras saknade värden, se Faktaruta: Interpolerade värden. Träningsperioden är bestämd till 1962–2020, eftersom det är den period som interpolation enligt denna metod är möjlig. De mönster PCA-metoden hittar kan tillsammans med en beskrivning för hur nederbörden varierat i tid för dessa stationer över hela perioden användas för att uppskatta den genomsnittliga nederbörden för hela Sverige, år för år.

FAKTARUTA: INTERPOLERING

Då värden saknas i tidserier under perioden 1962–2020 interpoleras värden med hjälp av databasen PTHBV (Johansson, 2002). PTHBV är en databas med dagliga temperatur- och nederbördsvärden från 1961 för ett rutnät över Sverige med den rumslig upplösningen 4×4 km. Databasen täcker dock inte december 1960 vilket gör att vintern 1961 inte blir fullständig. Därför används här perioden 1962–2020. Varje observationsserie jämförs med en motsvarande tidserie av interpolerade värden från de fyra närmsta punkterna i PTHBV och ett kvadratiskt förhållande mellan de två tidserierna fastställs. Med hjälp av detta kvadratiska förhållande uppskattas saknade värden i de observerade tidserierna. Metoden för interpolering finns beskriven i detalj i artiklen Hur beräknas normalvärden?

FAKTARUTA: PCA

PCA baseras den matematiska idéen att det går att hitta en uppsättning egenvektorer och tillhörande egenvärden för en datamängd.

I vårat fall använder vi tidserier av nederbördsdata från vårt stationsnätverk och beräknar tidsseriernas kovarians. Kovariansen beskriver hur två serier varierar relativt varandra. Är till exempel nederbörden ofta stor samma månader och liten samma månader på två olika stationer är kovariansen stor och positiv för de två stationerna. Är nederbörden ofta stor på en station samtidigt som den är liten på en annan station och tvärtom är kovariansen stor men negativ. Är nederbörden omväxlande stor och liten på de två stationerna utan något mönster är kovariansen däremot liten. Gör man en tabell över kovariansen mellan alla stationer i ett stationsnätverk, får man något som kallas kovariansmatris. För en matris A kan man finna en uppsättning vektorer X och en lista värden λ som uppfyller:

AX = λX

X kallas då egenvektorer och λ egenvärden.

I PCA-metoden beräknas egenvektorer för stationsnätverkets kovariansmatris, vilket alltså beskriver hur nederbörden varierar geografiskt. En sådan kovariansmatris måste dock vara fullständig, så helt kompletta nederbördserier krävs. Som nämnts ovan är väldigt få stationer kompletta över hela tidsperioden.

Nästa steg är att använda alla tillgängliga observationer för de utvalda stationerna tillsammans med egenvektorerna för att få en beskrivning av hur datan varierar i tid i form av något som kallas "tidsexpansionsvektorer". Med hjälp av dessa kan sedan ett fullständigt uppskattat dataset beräknas. Under träningsperioden kommer datan att vara identisk med den egentliga datan. Det kan dock inte förväntas att extremvärden kommer att återskapas utanför träningsperioden. För klimatindikatorn vilket bygger på medelvärden är extremvärden dock mindre viktiga.

Referenser

Alexandersson, H. (2003). Korrektion av nederbörd enligt enkel klimatologisk metodik. Rapport: Meteorologi 111. SMHI.
Korrektion av nederbörd enligt enkel klimatologisk metodik. (5,3 MB, pdf)

Björnsson H. och Venegas S. A. (1997). A manual for EOF and SVD analyses of climatic data. CCGCR Report 97. Centre for Climate and Global Change Research, McGill University. Tillgänglig: www.geog.mcgill.ca/gec3/wp-content/uploads/2009/03/Report-no.-1997-1.pdf

Johansson, B. (2002). Estimation of areal precipitation for hydrological modelling in Sweden. Doktorsavhandling nr. A76. Institutionen för geovetenskaper, Göteborgs universitet.