Week 3: alignment
Opdracht voor week 3
Deze week ga je de code voor de alignment van de RNA-seq data uitwerken. Je werkt hiervoor verder in het Rmd bestand dat je gestart bent voor de opdracht van week 2. Het uitwerken van de alignment bestaat uit de alignment zelf en de analyse van de alignment statistieken.
De alignment
De alignment moet worden uitgevoerd met de align functie uit het Rsubread package. Bestudeer hiervoor goed de documentatie van deze functie. Een aantal aanwijzingen:
De fastq bestanden voor het project zijn al voor jullie gedownload. De bestanden zijn te vinden op de server in
/home/data/opra4v/fastq/. Zorg ervoor dat je alleen de bestanden gebruikt die horen bij de weefsels die je moet bestuderen (zie deze pagina).Voor de alignment heb je ook een referentiegenoom nodig. Deze wordt in een geïndexeerde vorm aangeleverd aan de
alignfunctie. De index bestanden voor het referentiegenoom zijn te vinden op de server in/home/data/opra4v/hg38_index/.We willen de fastq bestanden omzetten naar BAM bestanden. Deze BAM bestanden mogen alleen uniek gemapte reads bevatten.
Als je de
alignfunctie uitvoert, krijg je een tabel te zien met daarin de alignment statistieken. Je kunt deze tabel opslaan als variabele en gebruiken voor verdere analyses. Je doet dat zoals je altijd een variabele aanmaakt:
alignment_statistics <- align(........)
We hebben deze alignment statistieken nodig voor het volgende onderdeel.
Analyse van de alignment statistieken
Om een idee te krijgen van de alignment, gaan we de alignment statistieken visualiseren in een grafiek:
In de grafiek willen we voor elke BAM file weergeven wat het percentage uniek gemapte reads is.
Dit percentage staat niet standaard in de alignment statistieken van de
alignfunctie en moet je zelf berekenen op basis van de getallen die wel in die statistieken te vinden zijn.De grafiek voldoet aan de standaarden voor een goede grafiek (aslabels, legenda, titel, bijschrift etc.)
Uitleg in het Rmarkdown bestand
Zorg ervoor dat je Rmarkdown bestand wordt voorzien van tekst:
Schrijf een korte introductie waarin je uitlegt wat de onderzoeksvraag van het project en hoe je deze vraag gaat beantwoorden.
Geef een korte toelichting voor de alignment analyse en verantwoord de gebruikte R code in de tekst.
Geef de conclusies voor de alignment statistieken weer in de tekst.