Please use this identifier to cite or link to this item: http://doi.org/10.25358/openscience-5414
Authors: Duge, Friedrich Albert Christoph
Title: Clustering and predicting antidepressant response in patients with major depressive disorder – a machine learning based secondary analysis of “The EMC trial”-data
Clusterbildung und Prädiktion von Therapieverläufen depressiver Patienten – Eine Sekundäranalyse der „The EMC trial“-Daten mit Methoden des Maschinenlernens
Online publication date: 17-Dec-2020
Year of first publication: 2020
Language: english
Abstract: Current antidepressant treatment strategies in MDD evaluate treatment response only after 4 weeks of treatment duration. The early improvement criterium (20% sum score improvement after 2 weeks), which is currently state of the art for earlier prediction of treatment response, wasn’t proven to be an effective trigger for clinical decision making so far. This thesis investigates potential sources of predictive information other than symptom severity sum scores, in order to find new hypotheses for future treatment strategies. In Experiment 1, early treatment response patterns over time are identified by clustering with the k-means-algorithm and several possible cluster-structures are evaluated for mathematical fit as well as clinical interpretability. A structure with 5 clusters of early response is identified as a candidate for further investigation and hypothesis building. In Experiment 2, traditional clinical response and remission criteria are predicted using random forest classifiers with different sets of clinical variables at different timepoints as predictors. The classifiers are evaluated in comparison to the early improvement criterium which is being outperformed for some of the predictor sets at any timepoint. This shows that predictive information is contained in clinical variables other than the sum score. These variables are assessed and selected for further model building based on their relative feature importance scores. In Experiment 3, a random forest classifier based on the variables selected in Experiment 2 is trained to predict assignment to the clusters from Experiment 1, thereby combining the two sources of predictive information. The results show this prediction to be possible above the zeroinformation rate for later timepoints. In the combined discussion, the results from these three Experiments are combined to formulate two new hypotheses for treatment strategy. The first hypothesis assumes that the “Delayed Improvement” cluster from Experiment 1 benefits (on average) from treatment continuation longer than 4 weeks and the second hypothesis assumes that patients that will likely – based on predictions like in Experiment 3 – be part of the “Non Improvement” cluster from Experiment 1 benefit from early medication change. The role of the algorithms from this thesis for research into the hypotheses as well as their additional scientific use is discussed.
Aktuelle antidepressive Therapiestrategien für die Behandlung depressiver Erkrankungen evaluieren Therapieansprechen nach einer Therapiedauer von 4 Wochen. Das sogenannte „early improvement“-Kriterium (20% Symptom-Summenscore Verbesserung in 2 Wochen nach Therapiebeginn), der aktuelle Stand der Wissenschaft hinsichtlich früherer Verlaufsprädiktion, konnte nach bisheriger Datenlage bislang nicht als verlässliche klinische Entscheidungshilfe etabliert werden. Diese Dissertation untersucht potenzielle Quellen für neue prädiktive Information, um überprüfbare Hypothesen für zukünftige Therapiestrategien zu generieren. In Experiment 1 wurden typische Verlaufsmuster klinischen Ansprechens identifiziert, indem Therapieverläufe mit dem k-means-Algorithmus gruppiert werden. Mehrere mögliche Gruppierungen wurden hinsichtlich der Güte der mathematischen Beschreibung sowie ihrer klinischen Interpretierbarkeit untersucht und diskutiert. Eine Gruppierung in 5 typische Verlaufsmuster wurde als Kandidat für weitere Untersuchungen sowie Hypothesenbildung identifiziert. In Experiment 2 wurden random forest Klassifikationsalgorithmen eingesetzt, um Eintreten der traditionellen Response- und Remissionskriterien der Depression zu prädizieren. Hierzu wurden mehrere Gruppen von Variablen zu unterschiedlichen Zeitpunkten im Behandlungsverlauf als Prädiktoren eingesetzt. Die resultierenden Klassifikatoren werden mit dem „early improvement“ Kriterium verglichen, dabei erreichten erstere an jedem Zeitpunkt eine höhere Genauigkeit für wenigstens einen Teil der Prädiktorengruppen. Dies zeigte den prädiktiven Wert klinischer Variablen über die Summenscores hinaus. Die prädiktiven Variablen wurden anhand ihrer Bedeutung für die Klassifikation untersucht und für weitere Modellbildung ausgewählt. In Experiment 3 wurde ein random forest Klassifikationsalgorithmus mit den in Experiment 2 gewählten Prädiktionsvariablen trainiert, um Zugehörigkeit zu den Verlaufsgruppen aus Experiment 1 zu prädizieren. So wurden die beiden potenziellen Quellen für klinischen Informationsgewinn kombiniert. Es wurde gezeigt, dass diese Prädiktion im späteren Therapieverlauf über die Null-Informationsrate hinaus möglich ist. In der Diskussion wurden die Ergebnisse der drei Experimente zusammengefügt, um zwei neue Hypothesen zur antidepressiven Therapiestrategie abzuleiten. Die erste Hypothese nimmt an, dass Patienten aus der „Delayed Improvement“ Gruppe aus Experiment 1 im Durchschnitt von einer längeren antidepressiven Therapiedauer als 4 Wochen profitieren. Die zweite Hypothese nimmt einen Nutzen eines frühen Medikationswechsels bei Patienten an, bei denen eine spätere Zuordnung zur „Non Improvement“ Gruppe aus Experiment 1 mit hoher Wahrscheinlichkeit prädiziert wird (vergleichbar mit der Prädiktion in Experiment 3). Die Rolle der Algorithmen aus dieser Dissertation und deren Rolle für die zukünftige Hypothesenprüfung sowie zusätzliche wissenschaftliche Nutzung wurden diskutiert.
DDC: 610 Medizin
610 Medical sciences
Institution: Johannes Gutenberg-Universität Mainz
Department: FB 04 Medizin
Place: Mainz
ROR: https://ror.org/023b0x485
DOI: http://doi.org/10.25358/openscience-5414
URN: urn:nbn:de:hebis:77-openscience-ddffe51c-c7ff-45aa-8722-8a93de7c56cf1
Version: Original work
Publication type: Dissertation
License: CC BY-ND
Information on rights of use: https://creativecommons.org/licenses/by-nd/4.0/deed.en
Extent: 142 Seiten
Appears in collections:JGU-Publikationen

Files in This Item:
  File Description SizeFormat
Thumbnail
duge_friedrich_albert_christoph-clustering_and-20201127100836736.pdf5.21 MBAdobe PDFView/Open