Please use this identifier to cite or link to this item: http://doi.org/10.25358/openscience-1726
Authors: Stein, Frederic Alexander
Title: Shape-basierte Bewegungsklassifikation auf multidimensionalen Zeitreihen mit Hilfe elastischer Abstandsmaße
Online publication date: 12-Oct-2017
Year of first publication: 2017
Language: german
Abstract: Zusammenfassung Bewegungs-Zeitreihen sind in der heutigen Zeit allgegenwärtig. Durch die günstig verfügbaren Messsysteme wie z.B. Inertialsensoren in Smartphones und Fitness-Trackern, sowie Bewegungserfassungs-Systeme in der Unterhaltungs-Industrie wie z.B. Microsofts Kinect(TM) oder Nintendos Wii Remote(TM) lassen sich Bewegungs-Zeitreihen einfach, kostengünstig und in großer Zahl generieren. Die Erkennung einzelner Teilbewegungen bzw. Gesten spielt dabei eine bedeutende Rolle, z.B. bei Videospiel-Steuerungen oder bei der automatisierten Überwachung industrieller Fertigungsprozesse. Diese Arbeit beschäftigt sich im Wesentlichen mit der Shape-basierten Bewegungsklassifikation. Dies bedeutet, dass die Bewegungen (z.B. Gesten) in Form einzelner – im Allgemeinen mehrdimensionaler – Bewegungs-Zeitreihen (im Folgenden als „Shapes“ bezeichnet) vorliegen. Die Aufgabe besteht nun darin, ein Anfrage-Shape mit Hilfe von bekannten Bewegungsdaten einem entsprechenden Bewegungsmuster bzw. einer Geste zuzuordnen. Dieser Prozess wird auch als Klassifikation bezeichnet. Die One-Nearest-Neighbor- (1NN)-Klassifikation ist dabei das intuitivste und einfachste Vorgehen, welches zusätzlich eine einfache physikalische Interpretation der Bewegungs-Zeitreihen zulässt. Nach einer kurzen Einleitung in die Thematik werden die in dieser Arbeit verwendeten Datensätze kurz vorgestellt, auf denen die untersuchten Verfahren getestet werden. Neben einigen öffentlich frei zugänglichen Datensätzen wurde im Rahmen dieser Arbeit auch ein eigener Datensatz erzeugt. Dabei wurde die Hand verschiedener Probanden während des Zeichnens von Ziffern in 6 Freiheitsgraden (6-DoF) getrackt. Danach wird zunächst ein Verfahren vorgestellt, das mittels Continuous-Wavelet-Transformation einen Bewegungs-Datenstrom (semi-)automatisiert in einzelne Teilbewegungen (Shapes) segmentieren kann. Der Hauptteil dieser Arbeit beschäftigt sich anschließend mit der Shape-basierten Klassifikation von Bewegungen mittels Dynamic Time Warping (DTW). Um die 1NN-Klassifikation effizienter durchführen zu können, werden zuerst neue Lower Bounds für Bewegungs-Zeitreihen eingeführt, indem zwei in der Literatur bekannte Lower Bounds auf Quaternionen-wertige Zeitreihen erweitert werden. In diesem Zusammenhang wird eine schnell zu berechnende Approximation der komplexeren Lower Bound vorgestellt. Anschließend werden verschiedene Zeitreihen-Abstandsmaße, sowie verschiedene punktweise Abstandsmaße hinsichtlich ihrer Eignung für die Klassifikation miteinander verglichen. Die „Punkte“ der Zeitreihen sind in diesem Fall verschiedene Darstellungen von Rotationen. Im Anschluss wird noch ein neuartiger, bisher noch nicht bekannter Ansatz zur Klassifikation anhand von inkrementellen Rotationen beschrieben. Abschließend werden verschiedene Ansätze für eine Sensordaten-Fusion auf sehr unterschiedlichen Daten getestet und miteinander verglichen. Hierzu wird ein neuartiges – auf Dynamic Time Warping basierendes – Verfahren zur zeitlichen Synchronisation von Bewegungs-Zeitreihen vorgestellt, die in unterschiedlichen Koordinatensystemen dargestellt sind.
Abstract Motion time series are ubiquitous at present. Thanks to low-priced measuring systems such as inertial sensors in smartphones and fitness trackers, as well as motion detection systems in the entertainment industry, e.g. Microsoft’s Kinect(TM) or Nintendo’s Wii Remote(TM) motion time series can be easily and cost-effectively generated in large numbers. The recognition of individual partial movements or gestures plays an important role, e.g. for video game controls or automated monitoring of industrial production processes. This thesis focuses on the shape-based motion classification. This means that the movements (gestures) are represented in the form of single – generally multi-dimensional – motion time series, from here on referred to as “shapes”. The task is to assign a query shape to a corresponding movement pattern or a gesture, with the help of known motion data. This task is also known as classification. The one nearest neighbor (1-NN) classification is the most intuitive and straightforward procedure which also allows for a simple physical interpretation of the motion time series. After a brief introduction to the topic the datasets that will be used to test the investigated methods are presented. In addition to publicly accessible datasets a new dataset has been generated within this work. The hand of different test subjects was tracked with 6 degrees of freedom (6DoF) while drawing digits. Subsequently, a method is presented which uses a continuous wavelet transform to (semi-) automatically segment a motion data stream into subsequences (shapes). The core part of this thesis focuses on the shape-based classification of movements by means of dynamic time warping (DTW). To perform the 1-NN classification more efficiently new lower bounds are presented for motion time series by extending two well known lower bounds from the literature to quaternion-valued time series. In this context a fast approximation of the more complex lower bound is presented. Next, different time series distance measures as well as different pointwise distance measures are compared regarding their suitability for the classification. The “points” of the time series in this case are different representations of rotations. Subsequently, a novel approach to classification based on incremental rotations is described. Finally, different approaches for a sensor data fusion process are compared and tested on very different kinds of data. To this end, a novel method based on dynamic time warping is introduced for the temporal synchronization of motion time series, which are represented in different reference frames.
DDC: 004 Informatik
004 Data processing
Institution: Johannes Gutenberg-Universität Mainz
Department: FB 08 Physik, Mathematik u. Informatik
Place: Mainz
ROR: https://ror.org/023b0x485
DOI: http://doi.org/10.25358/openscience-1726
URN: urn:nbn:de:hebis:77-diss-1000015688
Version: Original work
Publication type: Dissertation
License: In Copyright
Information on rights of use: https://rightsstatements.org/vocab/InC/1.0/
Extent: XII, 175 Seiten
Appears in collections:JGU-Publikationen

Files in This Item:
  File Description SizeFormat
Thumbnail
100001568.pdf10.19 MBAdobe PDFView/Open