Optimisation of next generation sequencing methodologies for RNA modifications detection
dc.contributor.advisor | Helm, Mark | |
dc.contributor.author | Pichot, Florian | |
dc.date.accessioned | 2024-08-05T09:12:51Z | |
dc.date.available | 2024-08-05T09:12:51Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Ribonukleinsäure (RNA) ist ein wesentliches Biomolekül im Bereich des Lebens. Als Vermittler zwischen der in der Desoxyribonukleinsäure (DNA) enthaltenen genetischen Information und der Zelle hat ihre Regulierung einen großen Einfluss auf die Homöostase lebender Organismen. Die Entdeckung und Identifizierung chemischer Veränderungen auf Nukleotidebene in der RNA hat es ermöglicht, eine neue Ebene der Regulierung dieser Moleküle zu untersuchen. Angesichts der Bedeutung dieser chemischen Veränderungen im Bereich der Biologie wurde ein spezieller Begriff für die Untersuchung dieser Modifikationen geprägt: Epitranskriptomik. Mehr als 170 Modifikationen wurden inzwischen aufgelistet, und ihre Analyse hat zur Entdeckung zahlreicher Verbindungen zwischen diesen Veränderungen und verschiedenen Krankheiten wie Virusinfektionen, Krebs und neurodegenerativen Erkrankungen geführt. Die Epitranskriptomik birgt daher die Hoffnung auf die Entwicklung innovativer Behandlungen für bisher unheilbare Krankheiten. Von der großen Zahl der bisher identifizierten Modifikationen gibt es jedoch nur wenige Methoden, mit denen sie in RNA-Sequenzen genau lokalisiert werden können. Um diese Einschränkungen zu überwinden, befassen sich die hier vorgestellten Arbeiten mit der Entwicklung und Optimierung von Methoden zum Nachweis von Modifikationen durch Hochdurchsatz-Sequenzierung. Genauer gesagt liegt der Schwerpunkt dieser Arbeit auf der computergestützten Verarbeitung von Sequenzierungsdaten, um den Nachweis dieser modifizierten Nukleotide zu perfektionieren. In einem ersten Schritt wurde eine Methode zum Nachweis von 2'-O-Methylierungen mittels Hochdurchsatzsequenzierung (RiboMethSeq) auf transfer-RNA (tRNA) Proben aus Escherichia coli und Saccharomyces cerevisiae angewandt, um die Rolle dieser Modifikationen in der angeborenen Immunität zu untersuchen. Diese Studie enthüllte interessante Details über die Regulierung der Immunität, zeigte aber auch die Nachweisgrenzen von RiboMethSeq auf. Diese Einschränkungen sind hauptsächlich auf die nicht optimale Parametrisierung der verschiedenen Datenverarbeitungsstufen zurückzuführen, aber auch auf den Mangel an tRNA-Sequenzreferenzen, die für epitranskriptomische Studien geeignet sind. Diese Einschränkungen wurden gezielt angegangen, und es wurde eine gründliche Optimierung dieser beiden Konzepte vorgenommen, so dass in einer zweiten Studie die Zusammenhänge zwischen 2'-O-Methylierungen und angeborener Immunität eingehender analysiert werden können. Mit dem Ziel, die Grenzen der Erkennung von 2'-O-Methylierungen zu verschieben, wird schließlich das Potenzial von Deep-Learning-Algorithmen für die Erkennung von Modifikationen unter Verwendung von RiboMethSeq ribosomale RNA-Daten als Trainingsset für den Random Forest-Algorithmus erforscht. Zweitens werden alternative Methoden für den Nachweis von zwei Modifikationen, N6-Methlyadenosin (m6A) und Pseudouridin (Psi), entwickelt. Bestehende Nachweismethoden für diese Modifikationen weisen aufgrund der Art des gewählten Ansatzes Beschränkungen auf. Um diese Lücken zu schließen, wurden zwei alternative Verfahren vorgeschlagen, die auf der Induktion chemischer Signaturen beruhen, die von diesen Modifikationen ausgehen, und dann auf biologische Proben angewandt, wobei ihre Robustheit bei der Erkennung sowie ihre Qualität bei der Quantifizierung dieser Biomoleküle von Interesse bewiesen wurden. Die Arbeit schließt mit der gleichzeitigen Anwendung von drei Nachweismethoden - RiboMethSeq, AlkAnilineSeq und BisulfiteSeq - auf denselben Satz von Gehirnzellproben im Rahmen von Studien über neurodegenerative Erkrankungen. Die Kombination dieser Methoden ermöglichte es, fünf menschliche tRNA-Modifikationen zu kartieren und ihre jeweilige Quantifizierung je nach Art des Zellgewebes und der Stressbedingungen zu bestimmen. Diese Arbeit hat es uns ermöglicht, bereits in der Literatur gemachte Beobachtungen zu bestätigen, aber auch eine noch wenig untersuchte Modifikation, Dihydrouridin, als potenziell entscheidenden Faktor bei der tRNA-Fragmentierung herauszustellen. | de_DE |
dc.description.abstract | Ribonucleic acid (RNA) is an essential biomolecule in the domain of life. As a mediator between the genetic information contained in deoxyribonucleic acid (DNA) and the cell, its regulation has a major impact on the homeostasis of living organisms. The discovery and identification of chemical modifications at nucleotide level in RNA has made it possible to study a new layer of regulation of these molecules. In view of the importance of these chemical alterations within the biology domain, a specific term for the study of these modifications has been coined: epitranscriptomic. More than 170 modifications have now been listed, and their analysis has led to the discovery of numerous links between these alterations and various diseases such as viral infections, cancers and neurodegenerative diseases. Epitranscriptomic therefore holds out the hope of developing innovative treatments for yet incurable diseases. However, of the large number of modifications identified to date, few methods exist that can locate them precisely in RNA sequences. In order to overcome these limitations, the work presented here concerns the development and optimisation of methods for detecting modifications through high-throughput sequencing. More specifically, the focus of this work is on the computational processing of sequencing data in order to perfect the detection of these modified nucleotides. As a first step, an application of a method for detecting 2'-O-methylations via high-throughput sequencing entitled RiboMethSeq was carried out on tRNA samples from Escherichia coli and Saccharomyces cerevisiae with the aim of studying the role of these modifications in innate immunity. This study uncovered interesting details about the regulation of immunity, but also revealed detection limitations on the part of RiboMethSeq. These limitations are mainly due to the non-optimal parameterisation of the various data processing stages, but also to the lack of transfer RNA (tRNA) sequence references suitable for epitranscriptomic studies. These limitations have been specifically addressed and a thorough optimisation of these two concepts has been implemented, enabling a more in-depth analysis of the links between 2'-O-methylations and innate immunity in a second study. Finally, with the aim of pushing back the limits of 2'-O-methylation detection, the potential of deep learning algorithms for detecting modifications is explored using RiboMethSeq ribosomal RNA (rRNA) data as a training set for Random Forest algorithm. Secondly, development of alternative methods for the detection of two modifications, N6-methlyadenosine (m6A) and pseudouridine (Psi) is carried out. Existing detection methods for these modifications have limitations due to the nature of the approach chosen. In order to fill these gaps, two alternatives processes based on the induction of chemical signatures emitted by these modifications were proposed and then applied to biological samples, proving their robustness of detection as well as their quality of quantification of these biomolecules of interest. Finally, this work concludes with the simultaneous use of three detection methods - RiboMethSeq, AlkAnilineSeq and BisulfiteSeq - on the same set of brain cell samples in the context of studies on neurodegenerative diseases. The combination of these methods enabled five human tRNA modifications to be mapped, and allowing their respective quantification according to the nature of the cell tissue and stress conditions. This work has enabled us to confirm in greater detail observations already seen in the literature, but also to highlight a still little-studied modification, Dihydrouridine, as a potential determining factor in tRNA fragmentation. | en_GB |
dc.identifier.doi | http://doi.org/10.25358/openscience-10431 | |
dc.identifier.uri | https://openscience.ub.uni-mainz.de/handle/20.500.12030/10449 | |
dc.identifier.urn | urn:nbn:de:hebis:77-openscience-5a3f1a91-1cfd-4808-bca2-52b5ba27eff85 | |
dc.language.iso | eng | de |
dc.rights | CC-BY-SA-4.0 | * |
dc.rights.uri | https://creativecommons.org/licenses/by-sa/4.0/ | * |
dc.subject.ddc | 004 Informatik | de_DE |
dc.subject.ddc | 004 Data processing | en_GB |
dc.subject.ddc | 540 Chemie | de_DE |
dc.subject.ddc | 540 Chemistry and allied sciences | en_GB |
dc.title | Optimisation of next generation sequencing methodologies for RNA modifications detection | en_GB |
dc.type | Dissertation | de |
jgu.date.accepted | 2023-12-08 | |
jgu.description.extent | xi, 397 Seiten ; Illustrationen, Diagramme | de |
jgu.organisation.department | FB 09 Chemie, Pharmazie u. Geowissensch. | de |
jgu.organisation.name | Johannes Gutenberg-Universität Mainz | |
jgu.organisation.number | 7950 | |
jgu.organisation.place | Mainz | |
jgu.organisation.ror | https://ror.org/023b0x485 | |
jgu.organisation.year | 2023 | |
jgu.rights.accessrights | openAccess | |
jgu.subject.ddccode | 004 | de |
jgu.subject.ddccode | 540 | de |
jgu.type.dinitype | PhDThesis | en_GB |
jgu.type.resource | Text | de |
jgu.type.version | Original work | de |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- optimisation_of_next_generati-20240610152625302.pdf
- Size:
- 22.67 MB
- Format:
- Adobe Portable Document Format
- Description:
License bundle
1 - 1 of 1
Loading...
- Name:
- license.txt
- Size:
- 3.57 KB
- Format:
- Item-specific license agreed upon to submission
- Description: