Die Datenmenge in Unternehmen wächst unaufhaltsam und auch deren notwendige Verfügbarkeit steht längst außer Frage. Deshalb befasst sich IT-Administrator im ... (mehr)

Technik hinter Netzwerk-Storage

Dabei fällt zunächst auf, dass alle verteilten Speicherlösungen auf die selben grundlegenden Prinzipien setzen. Allen Varianten ist gemein, dass sie das zuvor beschriebene Block-Problem durch eine Abstraktionsschicht lösen. Sie ziehen also zwischen der Schnittstelle, die Applikationen nutzen, und dem rotierenden Blech der Platten eine zusätzliche Schicht ein: Bei GlusterFS und XtreemFS ist das eine POSIX-kompatible Dateisystem-Ebene. Ceph fungiert hingegen als ein Objektspeicher, der Informationen in binäre Objekte umwandelt, bevor er sie auf einer Festplatte im Verbund ablegt. Bei allen drei Lösungen ist jedoch das Ergebnis das Gleiche: Es entstehen nahtlos skalierbare Speicher, die – anders als RAID – auf die physischen Eigenschaften einzelner Festplatten nahezu keine Rücksicht mehr nehmen müssen. Der Nutzer erhält ein Interface, das ihm den Zugriff über eine aufrechte Netzwerkverbindung erlaubt. Auf diese Weise ist ein weiteres Performance-Problem behoben, denn 10-GBit-Verbindungen sind gerade im Server-Umfeld mittlerweile üblich.

GlusterFS: Der POSIX-Weg

 GlusterFS [1] war einer der Pioniere im Hinblick auf verteiltes Storage: Bereits im Jahr 2006 veröffentlichte die Firma Gluster die erste Version ihres Programms, das als freie Software zur Verfügung steht. Bis heute zeichnet sich Gluster dadurch aus, dass es relativ leicht in Betrieb zu nehmen ist. Die Software besteht aus mehreren Diensten, die im Hintergrund vier Betriebsmodi kennen: Speichern in verteilter, replizierter, verteilt-replizierter und Stripe-basierter Art und Weise. Nach der Einrichtung entsprechender Volumes kümmern sich die Gluster-Dienste um alles Weitere (Bild 2). Nach außen hin bietet GlusterFS zwei Frontends an: Ein auf Fuse basierter Client ermöglicht den direkten Zugriff auf ein GlusterFS-Volume, als handle es sich um ein ganz normales POSIX-Dateisystem. Hinzu gesellt sich ein direkt in die Gluster-Dienste integrierter NFS-Server, der jedem NFS-Client den Zugriff per NFS-Protokoll ermöglicht.

Bild 2: GlusterFS verfolgt ähnliche Ansätze wie Ceph, ist aber kein Objektspeicher, sondern zielt auf die POSIX-Kompatibilität ab.

Von großer Bedeutung im RAID-Kontext ist dabei insbesondere die Replikation, die bei GlusterFS inhärent vorhanden ist. Hier wird offensichtlich, dass seit der Erfindung von RAID etliche Jahre verstrichen sind: War Redundanz damals noch eine Besonderheit, so gehört sie heute quasi zur Grundausstattung, und jede Speicherlösung würde sich lächerlich machen, wenn sie die Redundanz nicht von Haus aus mitbrächte. Genau das ist der Faktor, der RAID in modernen Set­ups überflüssig macht: Wenn sich die Applikation selbst bereits um die Redundanz ihrer Daten kümmert, ist eine zusätzliche Redundanz überflüssig – sie würde nur unnötig Netto-Kapazität verschlingen.

GlusterFS war für Red Hat jedenfalls so attraktiv, dass der Linux-Anbieter aus Raleigh sich Gluster eine Stange Geld kosten ließ: 2012 ging die Firma für rund 136 Millionen US-Dollar an Red Hat. Seither haben die roten Hüte die Pflege und die Verwaltung des Projekts übernommen.

comments powered by Disqus
Einmal pro Woche aktuelle News, kostenlose Artikel und nützliche ADMIN-Tipps.
Ich habe die Datenschutzerklärung gelesen und bin einverstanden.

Konfigurationsmanagement

Ich konfiguriere meine Server

  • von Hand
  • mit eigenen Skripts
  • mit Puppet
  • mit Ansible
  • mit Saltstack
  • mit Chef
  • mit CFengine
  • mit dem Nix-System
  • mit Containern
  • mit anderer Konfigurationsmanagement-Software

Ausgabe /2023