Please use this identifier to cite or link to this item: http://doi.org/10.25358/openscience-3635
Authors: Kuharev, Jörg
Title: Algorithmen zur labelfreien quantitativen Proteomanalyse auf Basis datenunabhängig-akquirierter LC-MS-Daten
Online publication date: 15-Dec-2015
Language: german
Abstract: Moderne ESI-LC-MS/MS-Techniken erlauben in Verbindung mit Bottom-up-Ansätzen eine qualitative und quantitative Charakterisierung mehrerer tausend Proteine in einem einzigen Experiment. Für die labelfreie Proteinquantifizierung eignen sich besonders datenunabhängige Akquisitionsmethoden wie MSE und die IMS-Varianten HDMSE und UDMSE. Durch ihre hohe Komplexität stellen die so erfassten Daten besondere Anforderungen an die Analysesoftware. Eine quantitative Analyse der MSE/HDMSE/UDMSE-Daten blieb bislang wenigen kommerziellen Lösungen vorbehalten. rn| In der vorliegenden Arbeit wurden eine Strategie und eine Reihe neuer Methoden zur messungsübergreifenden, quantitativen Analyse labelfreier MSE/HDMSE/UDMSE-Daten entwickelt und als Software ISOQuant implementiert. Für die ersten Schritte der Datenanalyse (Featuredetektion, Peptid- und Proteinidentifikation) wird die kommerzielle Software PLGS verwendet. Anschließend werden die unabhängigen PLGS-Ergebnisse aller Messungen eines Experiments in einer relationalen Datenbank zusammengeführt und mit Hilfe der dedizierten Algorithmen (Retentionszeitalignment, Feature-Clustering, multidimensionale Normalisierung der Intensitäten, mehrstufige Datenfilterung, Proteininferenz, Umverteilung der Intensitäten geteilter Peptide, Proteinquantifizierung) überarbeitet. Durch diese Nachbearbeitung wird die Reproduzierbarkeit der qualitativen und quantitativen Ergebnisse signifikant gesteigert.rn| Um die Performance der quantitativen Datenanalyse zu evaluieren und mit anderen Lösungen zu vergleichen, wurde ein Satz von exakt definierten Hybridproteom-Proben entwickelt. Die Proben wurden mit den Methoden MSE und UDMSE erfasst, mit Progenesis QIP, synapter und ISOQuant analysiert und verglichen. Im Gegensatz zu synapter und Progenesis QIP konnte ISOQuant sowohl eine hohe Reproduzierbarkeit der Proteinidentifikation als auch eine hohe Präzision und Richtigkeit der Proteinquantifizierung erreichen.rn| Schlussfolgernd ermöglichen die vorgestellten Algorithmen und der Analyseworkflow zuverlässige und reproduzierbare quantitative Datenanalysen. Mit der Software ISOQuant wurde ein einfaches und effizientes Werkzeug für routinemäßige Hochdurchsatzanalysen labelfreier MSE/HDMSE/UDMSE-Daten entwickelt. Mit den Hybridproteom-Proben und den Bewertungsmetriken wurde ein umfassendes System zur Evaluierung quantitativer Akquisitions- und Datenanalysesysteme vorgestellt.
Modern ESI-LC-MS/MS techniques allow for qualitative and quantitative characterization of thousands of proteins in a single bottom-up proteomics experiment. The data-independent LC-MS acquisition method MSE and its ion-mobility successors HDMSE and UDMSE are particularly suitable for label-free quantification of proteins. However, the high complexity of the acquired data poses a special challenge for the data analysis software. Only view and only commercially available softwares could approach the analysis of MSE/HDMSE/UDMSE data in the past.rn| In this work, we present a workflow consisting of a set of novel methods for the quantitative analysis of label-free MSE/HDMSE/UDMSE proteomics data. The developed methods were implemented in Java programming language and tied to an analysis pipeline as part of open-source software ISOQuant. Initially, the commercial software package PLGS is used for the feature detection and the peptide and protein identification. Then, the PLGS-preprocessed data is automatically imported into a relational database for the downstream processing. To solve data specific problems, the analysis workflow applies dedicated algorithms, namely pairwise and multiple retention time alignment, clustering corresponding features, multiple data filters, annotation of feature clusters, normalization of feature intensities, analysis of protein inference problem, redistribution of peptide intensities and absolute protein quantification. The data analysis using ISOQuant significantly increases the reproducibility of qualitative and quantitative results.rn| For benchmarking the performance of quantitative data analysis, we developed a set of exactly defined hybrid proteome benchmark samples. We acquired the benchmark samples using MSE and UDMSE methods and analyzed the data by Progenesis QIP, synapter and ISOQuant. In contrast to the competitors, ISOQuant generated highly reproducible results, both identifying high numbers of proteins and quantifying them with high precision and high accuracy.rn| In conclusion, the developed algorithms and workflow allow for accurate, reproducible qualitative and quantitative proteome analyses. With the ISOQuant software package, we present an easy and efficient tool for daily routine high-throughput analysis of label-free MSE/HDMSE/UDMSE proteomics data. With the hybrid proteome sample set and the evaluation metrics, we present a complete methodology for benchmarking quantitative label-free acquisition and data analysis systems.
DDC: 570 Biowissenschaften
570 Life sciences
Institution: Johannes Gutenberg-Universität Mainz
Department: FB 10 Biologie
Place: Mainz
ROR: https://ror.org/023b0x485
DOI: http://doi.org/10.25358/openscience-3635
URN: urn:nbn:de:hebis:77-42359
Version: Original work
Publication type: Dissertation
License: In Copyright
Information on rights of use: https://rightsstatements.org/vocab/InC/1.0/
Appears in collections:JGU-Publikationen

Files in This Item:
  File Description SizeFormat
Thumbnail
4235.pdf4.62 MBAdobe PDFView/Open