Please use this identifier to cite or link to this item: http://doi.org/10.25358/openscience-1836
Authors: Grawinkel, Matthias
Title: LoneStar : Design and evaluation of an energy-efficient, disk-based archival storage system
Online publication date: 13-May-2015
Language: english
Abstract: Bandlaufwerke waren bisher die vorherrschende Technologie, um die anfallenden Datenmengen in Archivsystemen zu speichern. Mit Zugriffsmustern, die immer aktiver werden, und Speichermedien wie Festplatten die kostenmäßig aufholen, muss die Architektur vor Speichersystemen zur Archivierung neu überdacht werden. Zuverlässigkeit, Integrität und Haltbarkeit sind die Haupteigenschaften der digitalen Archivierung. Allerdings nimmt auch die Zugriffsgeschwindigkeit einen erhöhten Stellenwert ein, wenn aktive Archive ihre gesamten Inhalte für den direkten Zugriff bereitstellen. Ein band-basiertes System kann die hierfür benötigte Parallelität, Latenz und Durchsatz nicht liefern, was in der Regel durch festplattenbasierte Systeme als Zwischenspeicher kompensiert wird.rnIn dieser Arbeit untersuchen wir die Herausforderungen und Möglichkeiten ein festplattenbasiertes Speichersystem zu entwickeln, das auf eine hohe Zuverlässigkeit und Energieeffizienz zielt und das sich sowohl für aktive als auch für kalte Archivumgebungen eignet. Zuerst analysieren wir die Speichersysteme und Zugriffsmuster eines großen digitalen Archivs und präsentieren damit ein mögliches Einsatzgebiet für unsere Architektur. Daraufhin stellen wir Mechanismen vor um die Zuverlässigkeit einer einzelnen Festplatte zu verbessern und präsentieren sowie evaluieren einen neuen, energieeffizienten, zwei- dimensionalen RAID Ansatz der für „Schreibe ein Mal, lese mehrfach“ Zugriffe optimiert ist. Letztlich stellen wir Protokollierungs- und Zwischenspeichermechanismen vor, die die zugrundeliegenden Ziele unterstützen und evaluieren das RAID System in einer Dateisystemumgebung.
Tape has been the predominant storage target for digital archives, but with workloads becoming more active and storage media like hard disk drives catching up on costs-per-byte, the archival storage stack needs to be reinvestigated. Reliability, integrity, and durability are the main goals of digital preservation, but the role of performance increases with active archives that provide near-online access to all stored data. A tape-only solution can not deliver the required parallelism, latencies, and throughput, which leads to disk-based caches as compensation.rnIn this thesis, we explore the challenges and opportunities of building a hard disk drive based storage system that aims to be highly reliable and energy efficient and is suited for active archives as well as cold storage environments. First, we analyze the storage land- scape and access behavior of a large digital archive to present a use case for the proposed architecture. Then, we develop mechanisms to improve the reliability of a single disk drive and propose and evaluate a new energy efficient two-dimensional RAID scheme that is optimized for “write once, read sometimes” workloads. Finally, we present journaling and caching schemes that support the underlying goals and evaluate the RAID scheme in a file system environment.
DDC: 004 Informatik
004 Data processing
Institution: Johannes Gutenberg-Universität Mainz
Department: FB 08 Physik, Mathematik u. Informatik
Place: Mainz
DOI: http://doi.org/10.25358/openscience-1836
Version: Original work
Publication type: Dissertation
License: in Copyright
Information on rights of use: https://rightsstatements.org/vocab/InC/1.0/
Appears in collections:JGU-Publikationen

Files in This Item:
File SizeFormat 
4050.pdf3.2 MBAdobe PDFView/Open