Week 1: de stappen van de workflow
In dit project gaan jullie aan de slag met RNA-sequencing data. In de eerste lesweek verdiepen jullie je in de herkomst van deze data en de verschillende stappen die nodig zijn om de data te analyseren. In de weken die volgen zul je die verschillende stappen uitwerken om een gegeven dataset te analyseren.
Wat is RNA-sequencing?
RNA-sequencing (RNA-seq) wordt gebruikt om het transcriptoom (= alle RNA moleculen) van een cel in kaart te brengen. Hiervoor wordt de nucleotide sequentie bepaald voor de RNA moleculen die aanwezig zijn in een cel. Vervolgens kunnen we de sequenties gebruiken om te bepalen of en in welke mate de verschillende genen in een cel tot expressie komen.
Stappen voor RNA-seq
RNA-seq bestaat uit verschillende stappen. De stappen zijn weergegeven in figuur 1 en worden hieronder toegelicht.
Stap 1: RNA wordt geïsoleerd uit de cellen. Vaak zijn we alleen geïnteresseerd in het messenger RNA en daarom is het belangrijk om ander RNA (bijvoorbeeld ribosomaal RNA) na de isolatie te verwijderen.
Stap 2: het RNA wordt vervolgens gefragmenteerd (vaak tot fragmenten van een paar honderd basen) en omgezet naar cDNA. Aan deze cDNA fragmenten worden vervolgens adapters geplaatst die ervoor zorgen dat elk cDNA molecuul dezelfde begin- en eindsequentie heeft.
Stap 3: de cDNA fragmenten worden op een flowcell van de sequencing machine gebracht. Hier worden de fragmenten geamplificeerd en vervolgens wordt de sequentie bepaald met fluorescent gelabelde nucleotiden.
Het resultaat van de sequencing wordt vastgelegd in FASTQ files. Hierin staat voor elke read de sequentie en de kwaliteitsscores voor de sequencing. De FASTQ files zijn het startpunt voor de data analyse.
Opdracht voor week 1
De data analyse voor RNA-seq bestaat uit verschillende stappen. In dit project ga je aan de slag met een aantal daarvan:
- Alignment van de sequencing reads op het referentiegenoom.
- Genereren van een count tabel met daarin de read counts per gen.
- Uitvoeren van een DGE analyse (differential gene expression analyse) om verschillen tussen condities te bepalen.
- Uitvoeren van een GO-term enrichment analyse om de gevonden verschillen biologisch te duiden.
Verdiep je in de bovengenoemde stappen. Je kunt hiervoor het internet gebruiken, inclusief literatuur en generatieve AI (Copilot / ChatGPT). Ook kun je (specifieke!) vragen stellen aan je tutor.
Maak een video waarin jullie de verschillende data analysestappen voor RNA-sequencing in eigen woorden uitleggen. Je mag in deze video zelf in beeld zijn, maar dat hoeft niet. Je mag zelf weten hoe je je verhaal onderbouwt (powerpoint, creatieve dansjes etc.). De video mag niet langer zijn dan 5 minuten.
De video moet aan het einde van week 1 via Canvas worden ingeleverd.