<- read.csv("my_data_file.csv")
data # excluded as participant entered an invalid CPR number
<- data %>% filter(id != "2321369-1212") data
RRR – Workflow #1
1 Reproducible Research
Lad os sige, at du har opdaget en fejl i dit datasæt … et forkert CPR nummer. Du kunne f.eks beslutte at slette det data punkt fra dine data sådan her:
…men hvorfor ikke bare slette den række fra csv filen?
Reproducible Research
I følge principperne for Reproducible Research skal hele processen fra rådata til output være:
- scripted (kodet)
- reproducérbart
- reversibelt
Hvad sker der mon seks måneder senere, når en-eller-anden opdager at du har downloadtet 106 rækker data fra RedCap, men du i dit manuskript skriver at n=105? Tror du, at du kan huske hvor den sidste observation blev af?
Eller for et mere dramatisk eksempel, se denne youtube video
når du har tid (~20 minutes)