Resurser

Svar på vanliga frågor om medicinsk statistik samt praktiska guider för dig som arbetar med oss.

FAQ

Vanliga frågor

Här samlar vi svar på de vanligaste frågorna vi får från forskare och kliniker.

Hittar du inte svar på din fråga? Kontakta oss – vi hjälper dig gärna!

Innan studien startar

Helst innan! Kontakta oss gärna redan när du skriver din anslagsansökan (t.ex. till ALF eller Vetenskapsrådet). Då kan vi hjälpa till med studiedesign, uppskatta kostnaden för statistiken till din budget och göra powerberäkningar.
Det beror på hur stor skillnad du förväntar dig, spridningen i data och vilken felmarginal du accepterar. En powerberäkning tar hänsyn till detta och ger dig ett vetenskapligt motiverat antal. Vi rekommenderar starkt att vi gör denna beräkning innan datainsamlingen startar.
Ja, i den mån det är möjligt. Att i förväg definiera primär frågeställning, utfallsmått och analysmetod (gärna i ett studieprotokoll) är god vetenskaplig praxis. Det minskar risken för att resultaten ifrågasätts i efterhand.

Samarbete & Praktiska frågor

Det varierar beroende på datakvalitet, datamängd och frågeställningens komplexitet. En stor del av tiden går ofta åt till datatvätt och att skapa data som lämpar sig för analys. Kontakta oss i god tid så att vi kan planera in arbetet.
Priset beror på projektets omfattning. Hör av dig med en kort beskrivning av ditt projekt så tar vi fram ett kostnadsförslag.
Vi följer ICMJE-riktlinjerna. Om vi bidrar substantiellt till studiedesign, utför och tolkar analyserna samt medverkar i manuskriptarbetet, är medförfattarskap motiverat. Vid mindre insatser och ren rådgivning omnämns vi istället gärna i "Acknowledgements". Vi diskuterar alltid detta öppet innan vi startar.

Data, säkerhet och överföring

Ja, absolut. Data får inte innehålla namn, personnummer eller andra direkta identifierare. Använd ett löpnummer (t.ex. Study_ID) för varje patient. Kodnyckeln behåller du själv och förvarar säkert enligt din institutions regler. Vi arbetar enbart med den avidentifierade filen.
Skicka aldrig forskningsdata via vanlig e-post, även om den är avidentifierad. Använd godkända plattformar för säker filöverföring. Saknar du ett säkert system kan vi sätta upp en överföringslänk åt dig.
Vi läser de flesta format – Excel, CSV, SPSS och REDCap-export. Tomma celler tolkas alltid som saknade värden; lämna dem blanka. Samlar du data i Excel rekommenderar vi vår checklista för Excel.

Statistiska metoder

Det beror på din frågeställning, din studiedesign och dina variabler. Du behöver inte veta detta i förväg – det är precis detta vi är till för att hjälpa dig med!
Ett p-värde anger sannolikheten att få ditt observerade resultat under förutsättning att nollhypotesen är sann. Det säger inget om hur stor eller kliniskt viktig effekten är. Ett konfidensintervall anger ett intervall av rimliga värden för den sanna effekten och är ofta mycket mer informativt, vilket allt fler tidskrifter kräver idag.
Inte alltid. Många metoder är robusta mot avvikelser, särskilt vid större urval. Vid mindre dataset eller vid tydlig skevhet använder vi icke-parametriska alternativ. Vi bedömer alltid datans fördelning innan vi väljer metod.

Rapportering och publicering

Det finns etablerade riktlinjer beroende på studietyp. Vi hjälper dig att säkerställa att rapporteringen följer aktuella krav.
Ja. Vi kan både skriva och granska metodbeskrivningen, sammanställa resultattabeller och skapa snygga, publiceringsklara figurer.
Ja, detta är en mycket vanlig situation. Hör av dig med granskarens kommentarer så tittar vi gemensamt på vad som krävs för att svara på kritiken på bästa sätt.

Checklista

Att tänka på vid inmatning av forskningsdata i Excel

Generellt rekommenderas att data matas in i en databas via ett anpassat gränssnitt (t.ex. Medicase, REDCap, Viedoc). Om Excel ändå är det verktyg som används, hjälper denna checklista till att minimera risken för fel och skapar en datastruktur som fungerar smidigt för statistisk analys.

Vi kan givetvis läsa alla filer som skickas till oss, men genom att följa dessa instruktioner underlättar du vårt arbete, reducerar vår arbetsinsats (billigare för dig) och säkerställer datakvaliteten.

1. Grundläggande struktur

Det viktigaste är att filen har en enkel och konsekvent struktur.

  • En variabel per kolumn: Varje kolumn representerar en variabel (t.ex. ålder, vikt, behandlingsgrupp).
  • En observation per rad: Varje rad representerar en unik observation (t.ex. en patient, ett prov, en tidpunkt).
  • Variabelnamn på första raden: Rad 1 ska endast innehålla korta, beskrivande variabelnamn (t.ex. pat_id, age_at_diagnosis, gender). Använd inga specialtecken eller mellanslag – använd understreck istället (min_variabel).
  • Data från rad 2: Själva datavärdena ska börja direkt på rad 2. Lägg inga extra rubriker, sammanfattningar eller tomma rader mellan variabelnamnen och datan.
  • En enda datatabell per flik: Blanda inte flera tabeller, bilder eller diagram på samma flik som rådatan. En flik = en datatabell.

2. Hantering av data och värden

  • Ett värde per cell: Mata endast in ett värde i varje cell. Skriv t.ex. inte "180 cm" – dela istället upp i två variabler: längd (värde: 180) och längd_enhet (värde: "cm").
  • Tomma celler för saknade värden: Om ett värde saknas, lämna cellen helt tom. Skriv inte "saknas", "ej mätt", "NA", "–", "?", "*", "999" eller liknande. En blank cell är standard för saknade värden och förstås av alla statistikprogram.
  • Var konsekvent: Om du använder textkoder, se till att de är identiska varje gång. "Ja", "ja" och "JA" tolkas som tre olika värden. Välj en form och håll dig till den. Filter-funktionen i Excel är ett bra verktyg för att hitta inkonsekvenser.
  • Inga formler: Undvik att ha formler i rådatafilen om du är osäker på hur detta fungerar. Vi kan hjälpa till att skapa dessa variabler senare.
  • Datumformat: Använd alltid samma format för datum, helst det internationella formatet ÅÅÅÅ-MM-DD (t.ex. 2023-11-28). Detta format är entydigt och undviker förväxling med andra format.

3. Variabeltyper och formatering

  • Blanda inte text och siffror: En kolumn som ska innehålla siffror (t.ex. ålder) får inte innehålla text (t.ex. "ca 45"). Detta tvingar hela kolumnen att tolkas som text, vilket omöjliggör beräkningar.
  • Siffror ska vara siffror: Ibland formaterar Excel siffror som text (visas med en liten grön triangel i hörnet och är vänsterjusterade). Markera kolumnen, klicka på varningssymbolen och välj "Konvertera till tal".
  • Koda kategorier numeriskt: För kategoriska variabler (t.ex. kön, ja/nej-frågor), använd siffror istället för text. Skapa en separat flik som fungerar som kodnyckel/datadictionary.
    Exempel: rökare: 1 = Ja, 0 = Nej  |  kön: 1 = Man, 2 = Kvinna
  • Ingen "kosmetisk" formatering: Använd inte färger, fetstil eller kursiv text för att koda information. Att markera en avvikande cell med röd färg försvinner vid inläsning till statistikprogram. Skapa istället en ny kolumn och beskriv saken där.

4. Layout och "Gör inte"-regler

  • Sammanfoga inte celler: Använd aldrig "Merge Cells". Det skapar problem vid sortering, filtrering och inläsning.
  • Dölj inte rader eller kolumner: Dold data kan lätt glömmas bort eller orsaka fel. All data som ska analyseras ska vara synlig.
  • Inga summeringar i filen: Lägg inte in summeringar, medelvärden eller andra beräkningar längst ner i din datatabell. Dessa kan av misstag läsas in som en sista observation.
  • Använd "Lås fönsterrutor" (Freeze Panes): Om du har många kolumner och vill se patient-ID hela tiden, använd "Lås fönsterrutor" istället för att upprepa ID-kolumnen på flera ställen.
  • Var försiktig med att radera: Använd Delete-tangenten för att rensa innehållet i celler. Om du högerklickar och väljer "Ta bort…", var försiktig så du inte väljer "Flytta celler uppåt/vänster" – detta förskjuter hela datastrukturen och kan leda till katastrofala fel.

5. Datakontroll – tips för att hitta fel

Innan du skickar filen, gör några enkla kontroller:

  • Använd Filter: Aktivera filter på din rubrikrad. Klicka på pilen för en kolumn för att se alla unika värden. Här kan du snabbt upptäcka stavfel ("Man", "man", "Mna") eller orimliga värden.
  • Kontrollera min/max: Markera en numerisk kolumn. Längst ner i Excels statusfält kan du se Min, Max och Medelvärde (högerklicka på statusfältet om de inte syns). Ser maxvärdet för ålder rimligt ut?
  • Hitta dubbletter: Använd villkorsstyrd formatering för att markera dubblettvärden i en ID-kolumn och säkerställa att varje rad är unik.
  • Zooma ut: Zooma ut kraftigt för att få en visuell överblick. Ibland kan man då se rader eller kolumner som avviker i format eller är tomma av misstag.

Frågor om din data?

Tveka inte att höra av dig – vi hjälper dig gärna att förbereda och strukturera ditt datamaterial.

Kontakta oss