Rådata laddas ner och granskas
Bearbetningen av data inleds normalt med att rådata laddas ner från berörda datavärdar. När det gäller data från svensk akvatisk miljöövervakning är dessa SMHI, SLU (Sveriges lantbruksuniversitet) och SGU (Sveriges geologiska undersökning). I samband med importen sker även en granskning av att all data som förväntas vara med i nedladdningen faktiskt har lagts in i datavärdens databas. Vidare justeras vissa dataformat för att underlätta fortsatt dataanalys med statistisk programvara.
I några fall hämtas även bearbetade data från datavärd eller utförare av miljöövervakning. Detta gäller till exempel miljögifter i biota, där datavärdens databas håller på att omorganiseras, och uppskattningarna av de marina fiskbeståndens storlek, där hanteringen av rådata bedömdes kräva särskild expertkompetens. På sikt är målet att all data som visas på Sveriges vattenmiljö ska hämtas från de nationella datavärdarna.
En grundläggande kvalitetsgranskning av enskilda mätvärden förutsätts ha skett hos utförare och datavärd. Inom Sveriges vattenmiljö inriktas därför granskningen på att undersöka om variationen i tid och rum är rimlig. För detta ändamål genereras i statistikprogrammen SAS och R ett stort antal tidsseriegrafer som sedan granskas visuellt. Vidare utnyttjas ett geografiskt informationssystem (QGIS) för att kontrollera, komplettera och sammanställa kopplingar av mätvärden till vattenförekomster och bedömningsområden. Fördjupade analyser av datakvalitet utförs om det finns indikationer på allvarliga kvalitetsproblem.
Presenteras som tidsseriegrafer
Presentationen av data på webben bygger på tidsseriegrafer av årsvärden per station, vattenförekomst eller bedömningsområde. Sötvattensdata redovisas enbart per station, medan marina data, med undantag för utsjöfisk och säl, redovisas i två steg. Först visas grafer per vattenförekomst, där data från olika stationer har olika färg, och därefter kan besökaren klicka sig vidare till grafer för enskilda stationer. Mätvärden som inte kunnat kopplas till någon station i det nationella stationsregistret visas inte alls i Sveriges vattenmiljö..
För de variabler som ingår i statusklassningen av ekologisk status eller miljöstatus har årsvärdena beräknats enligt de bedömningsgrunder som fastlagts inom vattenförvaltningsförordningen respektive havsmiljöförordningen. För samtliga variabler anges i anslutning till tidsseriegraferna om årsvärdet är ett medelvärde, totalvärde eller extremvärde och om det är beräknat på ett helt år eller en viss säsong.
Data från enbart nationell miljöövervakning kan visas om så önskas, och ett val av visningsläge kan göras i kartans filter (ALL/NATIONELL). Andelen nationell eller regional data markeras också i anslutning till varje punkt i graferna. Formella statusklassningar (enligt vattenförvaltningsförordningen) av vattenförekomsterna, där sådana finns, görs tillgängliga genom länk till VISS (Vatteninformationssystem Sverige).
Statistiska trendanalyser utförs enbart för tidsserier med data från minst 10 år. För att avgöra om det vid en given station finns en uppåt- eller nedåtgående trend under den tidsperiod som visas på grafen utförs ett icke-parametriskt statistiskt test (Mann-Kendalltest) som är baserat på rangordningen av de observerade årsvärdena. Signifikant uppåtgående eller nedåtgående trend visas med färgad pil i anslutning till grafen. För att tydliggöra pucklar och andra icke-linjära trender anpassas också mjukt varierande trendkurvor till årsvärdena. Detta sker med hjälp av så kallade GAM-modeller. För marina vattenförekomster utförs även ett sammanvägt Mann-Kendalltest för samtliga stationer inom en vattenförekomst. Resultatet av sådana tester visas genom att vattenförekomstens centrumpunkt på kartan färgkodas. Skript för trendanalyserna finns tillgängliga i statistikprogrammet SAS och programmeringsspråket R.
Samtliga årsvärden som utnyttjas för grafer eller trendanalyser görs tillgängliga för nedladdning. Även graferna i sig går att ladda ner eller skriva ut.
Problem förknippade med datahantering
I det stora datamaterial som redovisas i Sveriges vattenmiljö är det oundvikligt att en del fel och brister i rådata och datahantering kan ge oönskat utslag i analyser och grafer. Problemen kan vara av två huvudtyper. Den första typen innefattar bland annat rena mätfel och felaktig leverans till datavärden. Den andra typen av problem kan uppstå om det är obalanser i dataunderlaget för ett vattenområde Sådana obalanser kan bero på att provtagningens utförande förändrats med tiden, avseende metoder, provtagningsplatsernas antal, lägen eller djup, eller att årstider eller frekvens för provtagningarna ändrats. Denna typ av problem kan alltså uppkomma även om inga rena hanteringsfel begåtts. Ofta handlar det om att dataunderlaget för en del vattenförekomster kommer från olika utförare, att undersökningar haft olika upplägg och syften, eller att övervakningsprogram helt enkelt förändrats över tiden.
Ambitionen inom Sveriges vattenmiljö är att successivt utveckla rutinerna för kvalitetssäkring av data, och därmed eliminera fel och osäkerheter samt hantera obalanser i data så långt det är möjligt. I denna version av sajten har problemen med obalanser reducerats genom att datavisningen begränsats till mätvärden som kunnat kopplas till det nationella stationsregistret. Besökaren kan också välja att se grafer och statistiska analyser för enbart nationell miljöövervakning. I övrigt har inga datamängder uteslutits, förutom några som fallit bort i en grov kvalitetskontroll. Osäkerheter och problem som upptäcks rapporteras till datavärdarna, som kan välja att korrigera felaktigheter.