Please use this identifier to cite or link to this item: http://doi.org/10.25358/openscience-7738
Authors: Huesmann, Regina
Advisor: Hoffmann, Thorsten
Thines, Eckhard
Title: Non-targeted chromatographic high-resolution mass spectrometric analysis of biological and medical matrices with emphasis on the classification of fungal spores
Online publication date: 20-Oct-2022
Year of first publication: 2022
Language: english
Abstract: Primäre biologische Aerosolpartikel (PBAP) sind in der Erdatmosphäre allgegenwärtig und bestehen hauptsächlich aus Pilzsporen, Pollen, Bakterien und Viren. Pilzsporen sind die prominentesten PBAP. Sie können sowohl als Allergene als auch als Krankheitserreger wirken und damit die menschliche Gesundheit als auch landwirtschaftlich genutzte Pflanzen schädigen. Herkömmliche Methoden zur Untersuchung von Pilzsporen bestehen aus mikrobiologischen und mikroskopischen Methoden, oder aus der Analyse des Genoms. Diese Methoden sind zeitintensiv und entweder nicht in der Lage die Pilzspezies präzise zu bestimmen, oder, wie im Falle der Genomanalyse präzise, aber arbeits- und kostenintensiv. Daher werden zusätzliche Methoden zur schnellen und einfachen Klassifizierung von Pilzsporen benötigt. Non-target Ultra-Hochleistungsflüssigkeitschromatographie gekoppelt mit hochauflösender Massenspektrometrie (UHPLC - HRMS) ermöglicht eine schnelle und umfassende Analyse des Metaboloms der Pilzsporen. Pilze produzieren eine Vielzahl von Verbindungen, darunter potenziell klassenunterscheidende Sekundärmetaboliten. Ziel dieser Arbeit war die Bewertung, ob eine Klassifizierung von Pilzsporen in die entsprechenden Klassen oder Spezies anhand ihres Metaboloms möglich ist, und wenn ja, die Entwicklung einer geeigneten Methode. Verschiedenste Algorithmen des maschinellen Lernens wurden untersucht, unter anderem Dimensionsreduktion, unüberwachtes Clustering und überwachte Klassifikation, um geeignete Methoden zu identifizieren. Die entwickelte Methode wurde für die Klassifizierung sowohl auf Klassen- als auch auf Spezies-Ebene angewendet. Die Methode beginnt mit der Extraktion der Pilzsporen durch Methanol, gefolgt von einer Normalisierung anhand der Anzahl und Größe der Pilzsporen. Die UHPLC-HRMS Messungen wurde auf einer C18-Säule durchgeführt, anschließend folgte die Massenanalyse mittels Orbitrap-Massenspektrometer. Die Ionisierung wurde mit Elektrospray (ESI) und chemischer Ionisierung bei Atmosphärendruck (APCI) durchgeführt, sowohl im positiven als auch im negativen Modus. ESI im positiven Modus erwies sich als die am besten geeignete Ionisierungsmethode. Die umfassende Datenanalyse enthält eine Log Transformation, gefolgt von einer z-Score Standardisierung und einer Dimensionalitätsreduktion durch Hauptkomponentenanalyse (PCA). Die überwachte Klassifizierung zeigte eine höhere Genauigkeit als das unüberwachte Clustering, wobei die Support Vector Machine mit linearem Kernel (SVM) die besten Ergebnisse lieferte. Die Unterscheidung verschiedener Pilzporen Klassen erreichte eine Genauigkeit von 99 % mit einer Standardabweichung von 3 %. Die Proben stammten aus vier Klassen respektive 5 Familien (Aspergillus, Botrytis, Cladosporium, Verticillium und Trichoderma spp.), mit 75 biologischen und zusätzlichen 20 technischen Replikaten. Für die Klassifizierung von verschiedenen Spezies wurden eine Genauigkeit von 95 % mit einer Standardabweichung von 5 % erreicht. Bei den Proben handelte es sich um 5 verschieden Spezies respektive 6 Stämmen der Gattung Trichoderma mit 42 biologischen und zusätzlichen 14 technischen Replikaten. Die Ergebnisse wurden durch 10-fache stratifizierte Kreuzvalidierung ermittelt und mittels Validierungsproben überprüft. Darüber hinaus wurde untersucht, ob klassen- oder spezies-spezifische Merkmale identifiziert wurden. Die hierarchische Clustering-Analyse zeigte einige spezies-spezifische Merkmale. Jedoch konnten aufgrund der hohen Variabilität zwischen den Spezies keine spezifischen Substanzen identifiziert werden, die als Marker verwendet werden könnten. Eine weitere Anwendung von non-target-UHPLC-HRMS umfasste ein kleines Probenset von Basidiomyceten Sporen auf Filtern aus dem Amazonas-Regenwald. Das hierarchische Clustering zeigte speziesspezifische Merkmalsregionen, die darauf hindeuten, dass eine Klassifizierung möglich ist. Maschinellen Lernalgorithmen für Non-Target-HRMS-Daten wurden nicht nur zur Analyse biologischer Matrices angewendet. Die hierarchische Clusteranalyse wurde in dieser Arbeit zur Untersuchung von E-Zigaretten Liquids und Kondensaten verwendet. Abschließend wurde gezeigt, dass eine Differenzierung von Pilzsporenklassen und -spezies auf der Grundlage der non-target UHPLC-HRMS-Analyse mittels Algorithmen des maschinellen Lernens möglich ist. Die Anwendung von maschinellem Lernen ermöglichte Einblicke in komplexe biologische und medizinische Matrizes, die sonst nicht möglich gewesen wären.
Primary biological aerosol particles (PBAP) are ubiquitous in the earth’s atmosphere and consist of fungal spores, pollen, viruses, bacteria, and debris of such. Fungal spores are the most prominent PBAP and can negatively impact human health and agricultural crops, as they can act as allergens and pathogens. Traditional methods for the investigation of the fungal bioaerosol consist of microbiological cultivation and microscopy techniques, or analysis of the fungal genome. These methods are time-consuming and either not able to precisely determine the fungal species, or in the case of genome analysis precise but labor and cost intensive. Therefore, additional methods for rapid and easy classification of fungal spores in environmental samples are needed. Non-target ultra-high-performance liquid chromatography high-resolution mass spectrometry (UHPLC – HRMS) allow a fast and comprehensive analysis of the fungal spores’ metabolome. Fungi produce a variety of compounds, including potentially class- or species-distinguishing secondary metabolites. The aim of this work was the evaluation whether it is possible to differentiate fungal spore classes or species based on their metabolome and if so, to develop a suitable workflow. Therefore, various machine learning algorithms, including dimensionality reduction, unsupervised clustering, and supervised classification methods, were investigated to find a suitable classification method. The developed workflow was applied to both class- and species differentiation. The developed workflow starts with the extraction of the fungal spores by methanol and is followed by sample normalization based on fungal spore count and size. UHPLC-HRMS measurements were performed on a C18 column followed by mass analysis with an orbitrap mass spectrometer. Ionization was carried out with electrospray- (ESI) and atmospheric pressure chemical ionization (APCI) in both positive and negative modes. ESI in positive mode was found to be the most suitable ionization method. The comprehensive data analysis included a log transformation followed by a z-score standardization and a dimensionality reduction by principal component analysis (PCA). Supervised classification showed higher accuracies than unsupervised clustering, whereby the support vector machine with linear kernel (SVM) producing the best results. The class differentiation of fungal spores resulted in classification accuracies of 99 % with a standard deviation of 3 %. Samples consisted of four classes from five different families (Aspergillus, Botrytis, Cladosporium, Verticillium and Trichoderma spp.) with a total of 75 biological and additional 20 technical replicates. Species differentiation resulted in classification accuracies of 95 % with standard deviations of 5 %. Samples belong to the genus Trichoderma and contained 5 species from six strains with a total of 42 biological and additional 15 technical replicates. Results were obtained by 10-fold stratified cross-validation and verified with validation samples. In addition, the classification of mixed-species samples was tested, resulting in correct classification according to the prevailing species in the sample. Furthermore, it was studied if features were detected that are class- or species-specific. Hierarchical clustering analysis revealed some species-specific feature spaces but due to high inter-species variability, no specific features which could be used as chemical tracers were detected. Additional applications of non-target UHPLC-HRMS included a provisional sample set of basidiomycetes spores on filters from the Amazonian rainforest. Hierarchical clustering showed species-specific feature regions, suggesting that classification by is possible. Data analysis with machine learning algorithms for non-target HRMS data was not only applied to biological matrices. Hierarchical clustering analysis was used in this work to study e-cigarette liquids and condensates. Concluding, it has been shown, that differentiation of fungal spore classes and species is possible based on non-target UHPLC-HRMS analysis using machine learning algorithms. The application of machine learning provided insights into complex biological and medical matrices, that would not have been possible otherwise.
DDC: 540 Chemie
540 Chemistry and allied sciences
570 Biowissenschaften
570 Life sciences
Institution: Johannes Gutenberg-Universität Mainz
Department: MaxPlanck GraduateCenter
Place: Mainz
ROR: https://ror.org/023b0x485
DOI: http://doi.org/10.25358/openscience-7738
URN: urn:nbn:de:hebis:77-openscience-02c170f2-63bc-4b13-9638-3a05eb8bc49e2
Version: Original work
Publication type: Dissertation
License: CC BY-ND
Information on rights of use: https://creativecommons.org/licenses/by-nd/4.0/
Extent: VII, 189 Seiten (Illustrationen, Diagramme)
Appears in collections:JGU-Publikationen

Files in This Item:
  File Description SizeFormat
Thumbnail
nontargeted_chromatographic_h-20220912120804352.pdfDissertation Regina Huesmann Non-targeted chromatographic high-resolution mass spectrometric analysis of biological and medical matrices with emphasis on the classification of fungal spores7.6 MBAdobe PDFView/Open