Potřebujete pomoci s analýzou sekvenačních dat?

Pracovní skupina CLIP nabízí zpracování a bioinformatickou analýzu sekvenačních dat ze všech sekvenátorů nové generace (NGS data). Z primárních dat pro vás vytvoříme validní, přehledné a snadno čitelné výsledky. 

Máme zkušenosti s analýzou dat ze sekvenování transkriptomů, exomů, amplikonů a methylomů. Námi vyvinuté analytické protokoly využíváme při stanovování příčin nejasných imunodeficitů a mutačního profilu u dětských leukémií, jejichž výzkumem se dlouhodobě zabýváme.

Naše pracoviště je hardwarově vybaveno pro analýzu objemných NGS dat (servery sestavené speciálně pro tyto úkoly) tak, aby i rozsáhlé analýzy proběhly v krátké době. Pracovní skupina CLIP-bioinformatika, složená z odborníků s biologickým a matematickým vzděláním, zaručuje komplexní (tedy nejen informatický) přístup k výsledkům.

Amplikonové/Exomové sekvenování

  • sekvenace DNA vybraných částí genomu (amplikonů) nebo všech exonů protein-kódujích genů

Analýza variant:

  • předzpracování primárních dat a kontrola jejich kvality (FastQC)
  • namapování na referenční genom – alignment (BWA)
  • odstranění PCR duplikátů (Picard)
  • variant calling (SAMtools, VarScan)
  • predikce škodlivosti a anotace variant (SnpEff, SnpSift, Polyphen)
  • namapování variant na KEGG databázi drah
  • určení minimální frekvence alel z NHLBI Exome Sequencing Project a 1000 Genomes Project Phase 1

 

Výstup (formát dat):

  • namapované sekvence (bam)
  • seznam nalezených variant, indelů a delecí (vcf)
  • tabulka nalezených variant s doplněnou predikcí škodlivosti a anotacemi (csv/xls)
  • výsledky kontrol kvality dat

 

Transkriptomové sekvenování (mRNA-Seq)

  • sekvenace mRNA

Analýza exprese:

  • předzpracování primárních dat a kontrola jejich kvality (FastQC)
  • namapování na referenční genom – alignment (TopHat)
  • spočtení sekvencí na gen – read count (HTSeq)
  • určení diferenciální exprese genů mezi 2 skupinami vzorků (edgeR, DESeq)

 

Výstup (formát dat):

  • namapované sekvence (bam)
  • seznam genů s mírou exprese vyjádřenou počtem namapovaných sekvencí
  • seznam diferenciálně exprimovaných genů mezi 2 porovnávanými skupinami
  • výsledky kontrol kvality dat

 

Methylomové sekvenování (RRBS)

  • sekvenace GpG bohatých oblastí a jejich širšího okolí pro určení úrovně DNA methylace

Analýza methylace:

  • předzpracování primárních dat a kontrola jejich kvality (FastQC)
  • namapování na referenční genom (Bismark)
  • určení míry methylace jednotlivých cytosinů (AMP)
  • anotace a analýza methylace na úrovni genomu (methylKit)
  • určení diferenciálně methylovaných cytosinů a/nebo oblastí (methylKit)

 

Výstup (formát dat):

  • namapované sekvence (bam)
  • seznam cytosinů s určenou mírou methylace (csv/xls)
  • seznam diferenciálně methylovaných cytosinů a/nebo oblastí mezi 2 porovnávanými skupinami (csv/xls)
  • výsledky kontrol kvality dat

 

Chromatin immunoprecipitation sequencing (ChIP-Seq)

  • sekvenace DNA po imunoprecipitaci chromatinu pro analýzu interakcí protein-DNA

Analýza vazby:

  • předzpracování primárních dat a kontrola jejich kvality (FastQC)
  • namapování na referenční genom (bowtie)
  • peak calling (macs2)
  • anotace vazebných míst (peaks) (ChIPpeakAnno)

 

Výstup (formát dat):

  • namapované sekvence (bam)
  • seznam vazebných míst (peaks) (csv/xls)
  • výsledky kontrol kvality dat

 

Podmínky zpracování dat závisí na velikosti a povaze projektu.

Biologická interpretace dat standardně není součástí této služby.

 

CLIP-bioinformatika

Mgr. Karel Fišer, Ph.D.

Mgr. Jan Stuchlý

Mgr. Alena Dobiášová, kontakt: @email

Vytvořeno: 1. 10. 2015 / Upraveno: 1. 2. 2019 / Mgr. Ing. Tereza Kůstková