Please use this identifier to cite or link to this item: http://doi.org/10.25358/openscience-870
Authors: Bukur, Thomas
Title: RNA-Seq based decomposition of human cell lines and primary tumors for the identification and quantification of viral expression
Online publication date: 27-Jun-2017
Year of first publication: 2017
Language: english
Abstract: Around twenty percent of all cancer cases are contributed to infectious agents, mostly to viruses. However, detection of viruses can be laborious, time-consuming, or require foreknowledge. Next generation transcriptome sequencing (RNA-Seq) of human samples is unbiased in the way that all included mRNAs can be sequenced, including foreign mRNA like viral transcripts. The analysis of viral expression profiles and their influence on the host is fundamental to understanding virus-associated oncogenesis in human. The hereby-presented study represents a step towards systems virology in cancer immunology. First, the software tool VirusID was developed for the qualified detection and identification of viruses in mammalian cells. VirusID was tested in benchmarks with known viral content and was slightly superior over other tools. It has since been in use for the identification of viral content in in-house and external sequencing RNA-Seq data at TRON and contributed to the TRON Cell Line Portal by delivering the identified viruses 1,082 cell lines. Subsequently, identified virus alignment profiles in RNA-Seq data encouraged the development of VIRGENE, a pipeline to retrieve viral gene expression levels. We applied VIRGENE to 186 cell line samples and confirmed known viruses like papillomaviruses or herpesviruses. In other cell lines, yet unknown virus content was identified like traces of murine retroviruses or bovine polyomaviruses. VIRGENE was then applied to primary tumors and revealed distinct expression profiles for Epstein-Barr virus between cell lines and tumor samples. However, BamHI-A rightward transcripts (BARTs) are consistently expressed. Furthermore, different Human papillomavirus expression profiles were identified in cervical cancer, which were associated with distinct overall survival of the respective patients. The diagnostic and prognostic potential of these biomarkers will have to be further assessed. This work shows the potential of screening existing RNA-Seq data for viruses and expressed viral genes. Diverse virus expression profiles have different effects on host gene expression and possibly also to disease outcome. The results produced by VIRGENE facilitate comprehensive studies of host and pathogen transcriptomic interplay. Prognostic, diagnostic, or therapeutic value is added by coupling the results with clinical annotation of cancer patients.
Etwa zwanzig Prozent aller Krebserkrankungen werden durch Infektionserreger verursacht, dabei machen Viren den größten Teil aus. Viren zu detektieren kann sehr arbeits- oder zeitaufwändig sein, außerdem benötigt man genaues Vorwissen. Die Analyse humaner Proben mittels moderner Hochdurchsatzsequenzierung von Transkriptomen (RNA-Seq) ermöglicht unvoreingenommen die Sequenzierung aller beinhalteter mRNA-Sequenzen einer Probe, einschließlich viraler mRNA. Untersuchungen viraler Expressionsprofile und deren Einfluss auf den Wirtsorganismus sind ein wesentlicher Bestandteil um ein Verständnis für Virus-induzierte Entstehung von Krebs im Menschen zu erhalten. Die vorgelegte Arbeit repräsentiert einen Schritt in Richtung der Systemvirologie in der Krebsimmunologie. Zunächst wurde die Software VirusID entwickelt um Viren in Säugetierzellen zu entdecken und zu identifizieren. VirusID wurde in Leistungsbewertungen überprüft und war bei der Detektion den anderen Methoden geringfügig überlegen. VirusID wurde weiter zur Untersuchung von internen und externen RNA-Seq-Daten im TRON eingesetzt. VirusID lieferte auch die identifizierten Viren in jeder der untersuchten 1.082 Zelllinien für das TRON Cell Line Portal. Die Identifikation viraler Profile in RNA-Seq-Alignments führte zur Entwicklung von VIRGENE, einer Softwarepipeline um virale Genexpressionen zu berechnen. VIRGENE wurde auf 186 Zelllinienproben angewandt. Hier konnten bekannte Viren wie etwa Papillomviren oder Herpesviren bestätigt werden. In anderen Fällen wurden bislang unbekannte Viren entdeckt, wie etwa Mäuseretroviren oder das Bovine Polyomavirus. VIRGENE wurde dann auf Daten von Primärtumoren angewandt und offenbarte unterschiedliche Expressionsprofile des Epstein-Barr-Virus in Zelllinien verglichen mit Tumorproben. Die sogenannten „BamHI-A rightward transcripts“ (BARTs) sind jedoch in fast allen Proben gleichbleibend exprimiert. Ausserdem konnten im Falle der humanen Papillomviren unterschiedliche Expressionsmuster in Zervixkarzinomen identifiziert werden. Die Patientinnen unterschiedlicher Gruppen zeigen auch unterschiedliche Überlebenschancen. Das diagnostische und prognostische Potenzial dieser Biomarker wird noch ausgewertet werden müssen. Diese Arbeit zeigt das Potenzial der Untersuchung bestehender RNA-Seq-Datensätze auf enthaltene Viren oder exprimierte virale Gene auf. Verschiedene Virusexpressionsmuster haben einen unterschiedlichen Einfluss auf die Genexpression des Wirtes und möglicherweise auch auf den Krankheitsverlauf. Die Ergebnisse von VIRGENE können umfangreiche Untersuchungen des Zusammenspiels von Wirts- und Erregertranskriptom ermöglichen. Die Verknüpfung mit klinischen Patientendaten führt zu einer Aufwertung der Ergebnisse in prognostischer, diagnostischer oder therapeutischer Hinsicht.
DDC: 570 Biowissenschaften
570 Life sciences
Institution: Johannes Gutenberg-Universität Mainz
Department: FB 10 Biologie
Place: Mainz
ROR: https://ror.org/023b0x485
DOI: http://doi.org/10.25358/openscience-870
URN: urn:nbn:de:hebis:77-diss-1000013823
Version: Original work
Publication type: Dissertation
License: In Copyright
Information on rights of use: https://rightsstatements.org/vocab/InC/1.0/
Extent: xi, 140 Blätter
Appears in collections:JGU-Publikationen

Files in This Item:
  File Description SizeFormat
Thumbnail
100001382.pdf4.37 MBAdobe PDFView/Open