RRR – Workflow #1

Author
Published

January 10, 2024

1 Reproducible Research

Lad os sige, at du har opdaget en fejl i dit datasæt … et forkert CPR nummer. Du kunne f.eks beslutte at slette det data punkt fra dine data sådan her:

data <- read.csv("my_data_file.csv")
# excluded as participant entered an invalid CPR number
data <- data %>% filter(id != "2321369-1212")

…men hvorfor ikke bare slette den række fra csv filen?

I følge principperne for Reproducible Research skal hele processen fra rådata til output være:

  • scripted (kodet)
  • reproducérbart
  • reversibelt

Hvad sker der mon seks måneder senere, når en-eller-anden opdager at du har downloadtet 106 rækker data fra RedCap, men du i dit manuskript skriver at n=105? Tror du, at du kan huske hvor den sidste observation blev af?

Eller for et mere dramatisk eksempel, se denne youtube video

når du har tid (~20 minutes)