Validation strategies for the detection of m5C by nanopore direct RNA sequencing

dc.contributor.advisorHelm, Mark
dc.contributor.authorÖzrendeci, Zeynep
dc.date.accessioned2026-06-01T10:57:49Z
dc.date.issued2026
dc.description.abstractRNA modifications play essential roles in gene expression, yet their reliable detection at single-site resolution remains a significant analytical challenge. Among these modifications, 5-methylcytidine (m5C) is particularly difficult to detect due to its subtle ionic current perturbation and typically low stoichiometry. This challenge persists even with nanopore direct RNA sequencing (DRS), the current cutting-edge platform for native RNA analysis. Despite advances in deep learning-based approaches, existing methods generate false-positive rates that preclude reliable site-specific interpretation. This thesis describes ModiCal (ModiDeC-based Calibration), a calibration-driven framework that repurposes a neural network classifier into a high-precision m5C validation tool. The work proceeded through two phases. In the first, different splint-mediated ligation strategies for generating site-specific modified RNAs were explored, including a chemical capping protocol for potential application in modification detection. Short ligation constructs were confirmed to be fully compatible with nanopore DRS. Attempted validation of putative 2′-O-methylation sites on SARS-CoV-2 transcripts by RiboMethSeq revealed systematic false-positive signals that were indistinguishable from genuine modification, exposing a fundamental limitation of cleavage-based detection and driving the transition to nanopore-based approaches. In the second phase, the ModiCal workflow was established using yeast 25S ribosomal RNA. A three-step calibration strategy was implemented: baseline training on synthetic ground-truth RNA, bulk false-positive suppression using in vitro transcribed reference RNA, and iterative single-site refinement. This approach reframes false-positive predictions as diagnostic readouts of misaligned decision boundaries. The calibrated model achieved background-free, enzyme-dependent detection of both characterized m5C sites on yeast rRNA. Applied to dengue virus genomic RNA, it confirmed a low-stoichiometry m5C site with zero false positives across the entire viral genome. Quantitative accuracy was further validated by stoichiometry titration. ModiCal establishes a map-and-validate paradigm in which discovery tools nominate candidates and calibration-based validation provides site-specific confirmation. The principles demonstrated here are modification-agnostic and applicable beyond m5C.en
dc.description.abstractRNA-Modifikationen spielen eine zentrale Rolle in der Genexpression, doch ihr zuverlässiger Nachweis auf Einzelpositionsebene stellt nach wie vor eine erhebliche analytische Herausforderung dar. Unter diesen Modifikationen ist 5-Methylcytidin (m5C) aufgrund seiner subtilen Ionenstrom-Perturbation und typischerweise niedrigen Stöchiometrie besonders schwer zu detektieren. Diese Herausforderung besteht selbst bei Nanopore-Direct-RNA-Sequencing (DRS), der derzeit fortschrittlichsten Plattform für die Analyse nativer RNA. Trotz Fortschritten bei Deep-Learning-basierten Ansätzen erzeugen bestehende Methoden Falsch-Positiv-Raten, die eine zuverlässige positionsspezifische Interpretation ausschließen. Diese Arbeit beschreibt ModiCal (ModiDeC-basierte Kalibrierung), ein kalibrierungsgetriebenes Framework, das einen neuronalen Klassifikator in ein hochpräzises m5C-Validierungswerkzeug überführt. Die Arbeit gliedert sich in zwei Phasen. In der ersten wurden verschiedene Splint-vermittelte Ligationsstrategien zur Herstellung positionsspezifisch modifizierter RNAs erprobt, einschließlich eines chemischen Capping-Protokolls zur potenziellen Anwendung in der Modifikationsdetektion. Kurze Ligationskonstrukte erwiesen sich als vollständig kompatibel mit Nanopore-DRS. Die versuchte Validierung potenzieller 2′-O-Methylierungsstellen auf SARS-CoV-2-Transkripten mittels RiboMethSeq ergab systematische Falsch-Positiv-Signale, die von echten Modifikationen nicht unterscheidbar waren. Dies legte eine grundlegende Limitation spaltungsbasierter Detektion offen und veranlasste den Wechsel zu Nanopore-basierten Ansätzen. In der zweiten Phase wurde der ModiCal-Workflow an ribosomaler Hefe-25S-RNA etabliert. Eine dreistufige Kalibrierungsstrategie wurde implementiert: Baseline-Training auf synthetischer Ground-Truth-RNA, Bulk-Unterdrückung von Falsch-Positiven mittels in-vitro-transkribierter Referenz-RNA und iterative Einzelsite-Verfeinerung. Dieser Ansatz interpretiert Falsch-Positiv-Vorhersagen als diagnostische Hinweise auf fehlkalibrierte Entscheidungsgrenzen. Das kalibrierte Modell erzielte hintergrundfreie, enzymabhängige Detektion beider charakterisierten m5C-Stellen der Hefe-rRNA. Angewandt auf Dengue-Virus-Genom-RNA bestätigte es eine m5C-Stelle niedriger Stöchiometrie bei null Falsch-Positiven über das gesamte virale Genom. Die quantitative Genauigkeit wurde durch Stöchiometrie-Titration validiert. ModiCal etabliert ein Map-and-Validate-Paradigma, bei dem Discovery-Tools Kandidaten nominieren und kalibrierungsbasierte Validierung positionsspezifische Bestätigung liefert. Die hier gezeigten Prinzipien sind modifikationsagnostisch und über m5C hinaus anwendbar.de
dc.identifier.doihttps://doi.org/10.25358/openscience-14941
dc.identifier.urihttps://openscience.ub.uni-mainz.de/handle/20.500.12030/14962
dc.identifier.urnurn:nbn:de:hebis:77-48206f06-e7f1-4f43-8008-6a72af1d37d28
dc.language.isoeng
dc.rightsCC-BY-4.0
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subject.ddc570 Biowissenschaftende
dc.subject.ddc570 Life sciencesen
dc.subject.ddc610 Medizinde
dc.subject.ddc610 Medical sciencesen
dc.subject.ddc540 Chemiede
dc.subject.ddc540 Chemistry and allied sciencesen
dc.titleValidation strategies for the detection of m5C by nanopore direct RNA sequencingen
dc.typeDissertation
jgu.date.accepted2026-04-28
jgu.description.extentxii, 115 Seiten ; Illustrationen, Diagramme
jgu.identifier.uuid48206f06-e7f1-4f43-8008-6a72af1d37d2
jgu.organisation.departmentFB 09 Chemie, Pharmazie u. Geowissensch.
jgu.organisation.nameJohannes Gutenberg-Universität Mainz
jgu.organisation.number7950
jgu.organisation.placeMainz
jgu.organisation.rorhttps://ror.org/023b0x485
jgu.rights.accessrightsopenAccess
jgu.subject.ddccode570
jgu.subject.ddccode610
jgu.subject.ddccode540
jgu.type.dinitypePhDThesisen_GB
jgu.type.resourceText
jgu.type.versionOriginal work

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
validation_strategies_for_the-20260601125749517132.pdf
Size:
14.21 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
5.14 KB
Format:
Item-specific license agreed upon to submission
Description: