Pracovní skupina CLIP nabízí zpracování a bioinformatickou analýzu sekvenačních dat ze všech sekvenátorů nové generace (NGS data). Z primárních dat pro vás vytvoříme validní, přehledné a snadno čitelné výsledky.
Máme zkušenosti s analýzou dat ze sekvenování transkriptomů, exomů, amplikonů a methylomů. Námi vyvinuté analytické protokoly využíváme při stanovování příčin nejasných imunodeficitů a mutačního profilu u dětských leukémií, jejichž výzkumem se dlouhodobě zabýváme.
Naše pracoviště je hardwarově vybaveno pro analýzu objemných NGS dat (servery sestavené speciálně pro tyto úkoly) tak, aby i rozsáhlé analýzy proběhly v krátké době. Pracovní skupina CLIP-bioinformatika, složená z odborníků s biologickým a matematickým vzděláním, zaručuje komplexní (tedy nejen informatický) přístup k výsledkům.
Amplikonové/Exomové sekvenování
- sekvenace DNA vybraných částí genomu (amplikonů) nebo všech exonů protein-kódujích genů
Analýza variant:
- předzpracování primárních dat a kontrola jejich kvality (FastQC)
- namapování na referenční genom – alignment (BWA)
- odstranění PCR duplikátů (Picard)
- variant calling (SAMtools, VarScan)
- predikce škodlivosti a anotace variant (SnpEff, SnpSift, Polyphen)
- namapování variant na KEGG databázi drah
- určení minimální frekvence alel z NHLBI Exome Sequencing Project a 1000 Genomes Project Phase 1
Výstup (formát dat):
- namapované sekvence (bam)
- seznam nalezených variant, indelů a delecí (vcf)
- tabulka nalezených variant s doplněnou predikcí škodlivosti a anotacemi (csv/xls)
- výsledky kontrol kvality dat
Transkriptomové sekvenování (mRNA-Seq)
- sekvenace mRNA
Analýza exprese:
- předzpracování primárních dat a kontrola jejich kvality (FastQC)
- namapování na referenční genom – alignment (TopHat)
- spočtení sekvencí na gen – read count (HTSeq)
- určení diferenciální exprese genů mezi 2 skupinami vzorků (edgeR, DESeq)
Výstup (formát dat):
- namapované sekvence (bam)
- seznam genů s mírou exprese vyjádřenou počtem namapovaných sekvencí
- seznam diferenciálně exprimovaných genů mezi 2 porovnávanými skupinami
- výsledky kontrol kvality dat
Methylomové sekvenování (RRBS)
- sekvenace GpG bohatých oblastí a jejich širšího okolí pro určení úrovně DNA methylace
Analýza methylace:
- předzpracování primárních dat a kontrola jejich kvality (FastQC)
- namapování na referenční genom (Bismark)
- určení míry methylace jednotlivých cytosinů (AMP)
- anotace a analýza methylace na úrovni genomu (methylKit)
- určení diferenciálně methylovaných cytosinů a/nebo oblastí (methylKit)
Výstup (formát dat):
- namapované sekvence (bam)
- seznam cytosinů s určenou mírou methylace (csv/xls)
- seznam diferenciálně methylovaných cytosinů a/nebo oblastí mezi 2 porovnávanými skupinami (csv/xls)
- výsledky kontrol kvality dat
Chromatin immunoprecipitation sequencing (ChIP-Seq)
- sekvenace DNA po imunoprecipitaci chromatinu pro analýzu interakcí protein-DNA
Analýza vazby:
- předzpracování primárních dat a kontrola jejich kvality (FastQC)
- namapování na referenční genom (bowtie)
- peak calling (macs2)
- anotace vazebných míst (peaks) (ChIPpeakAnno)
Výstup (formát dat):
- namapované sekvence (bam)
- seznam vazebných míst (peaks) (csv/xls)
- výsledky kontrol kvality dat
Podmínky zpracování dat závisí na velikosti a povaze projektu.
Biologická interpretace dat standardně není součástí této služby.
CLIP-bioinformatika
Mgr. Karel Fišer, Ph.D.
Mgr. Jan Stuchlý
Mgr. Alena Dobiášová, kontakt: @email