Week 2: de tools voor de workflow
Vorige week heb je je verdiept in de data analyse stappen voor een RNA-seq dataset. De stappen waren als volgt:
- Alignment van de sequencing reads op het referentiegenoom.
- Genereren van een count tabel met daarin de read counts per gen.
- Uitvoeren van een DGE analyse (differential gene expression analyse) om verschillen tussen condities te bepalen.
- Uitvoeren van een GO-term enrichment analyse om de gevonden verschillen biologisch te duiden.
Deze week ga je je verdiepen in de R functies die horen bij de verschillende stappen. In de onderstaande tabel vind je voor elke stap de bijbehorende functie in R en de documentatie die je kunt gebruiken om meer te leren over de functie:
| Stap | R functie (package) | Belangrijke argumenten | Documentatie |
|---|---|---|---|
| 1. Alignment | align (Rsubread) |
index, readfile1, type, input_format, output_format, output_file, unique en nthreads |
align help page |
| 2. Count tabel | featureCounts (Rsubread) |
files, annot.inbuilt, useMetaFeatures, strandSpecific, isPairedEnd, nthreads |
featureCounts help page |
| 3. DGE analyse | DESeq (DESeq2) |
object |
DESeq help page |
| 4. GO-term analyse | new("GOHyperGParams", ...) (GOStats) |
geneIds, universeGeneIds, annotation, ontology, pvalueCutoff, testDirection |
GOHyperGParams help page |
Opdracht voor week 2
Op de server staat een Rmarkdown template die we gaan gebruiken voor dit project. We zullen deze template stap voor stap gaan invullen en uitbreiden. Het doel is om aan het einde van het project een werkend Rmarkdown bestand te hebben die we kunnen gebruiken voor de analyse van RNA-seq data.
Het template bestand is te vinden op de server op de volgende locatie:
/home/data/opra4v/rnaseq_template.Rmd
Het doel van de opdracht is om te begrijpen wat de functies in de bovenstaande tabel nodig hebben aan input en om uit te kunnen leggen wat de functies doen. Bestudeer hiervoor voor elke functie de documentatie. In het template bestand staan comments, maar die zijn nu nog leeg. Zorg ervoor dat je informatieve comments maakt voor de verschillende functies en de verschillende argumenten in de functies en waarom deze belangrijk zijn voor de analyse. De comments moeten in eigen woorden zijn geschreven. Aan het einde van de week lever je de van comments voorziene template in bij de tutor.