Adrian Herrera

5 Must-Haves für die Datensicherung
im Petabyte-Bereich

Erinnern Sie sich als IT-Führungskraft noch daran, als es beim Schutz Ihrer Daten plötzlich nicht mehr um Megabyte, sondern um Gigabyte ging? Und dann nicht mehr um Gigabyte, sondern um Terabyte? Und Petabyte?

Wenn es bei Ihnen noch nicht um Petabyte geht, keine Bange, das wird noch früh genug der Fall sein. Angesichts der zunehmenden Digitalisierung der Arbeitsabläufe nimmt die Datenflut in Unternehmen rasant zu. Der durchschnittliche Swarm-Kunde hat fast ein Petabyte an Daten, und viele Kunden haben Milliarden von Dateien, auf die Hunderte bis Tausende von Nutzern zugreifen müssen. Bei dieser Größenordnung müssen Sie Ihre Datensicherung und -wiederherstellung überdenken. Es geht nicht nur darum, wo Sie heute stehen, sondern wo Sie in einigen Jahren sein werden.

Hier sind fünf Dinge, die Sie für den Schutz von Daten im Petabyte-Bereich benötigen und bei DataCore Swarm finden.

1. Automatisierte, schnelle Wiederherstellung

Automated, Fast RecoveryDas Erste, was man bedenken sollte, ist die Wiederherstellung. Ab einer bestimmten Größe ist ein Hardwareausfall unvermeidlich. Ihr Speichersystem muss so konzipiert sein, dass es dies voraussehen kann und in der Lage ist, Daten zuverlässig wiederherzustellen. Swarm Object Storage wurde von Grund auf für die Verwaltung von Milliarden von Dateien und Petabyte an Daten entwickelt. Dazu konzentriert sich Swarm auf die automatische Wiederherstellung und den integrierten Datenschutz ohne manuelle Intervention. Fast Volume Recovery nutzt einen verteilten Algorithmus mit einer Leistung, die mit der Clustergröße wächst. Dies wird automatisch bei verlorenen oder stillgelegten Datenträgern angewendet, um eine angemessene Replikation und den Erhalt von Objektsegmenten zu gewährleisten, die sich auf dem verlorenen/stillgelegten Datenträger befanden. Wenn ein beschädigtes Objekt identifiziert wird, wird es aktiv wiederhergestellt (im Gegensatz zu einer passiven Wiederherstellung, wie sie bei den meisten anderen Speicherlösungen der Fall ist).

2. On-Premise Infrastrukturmanagement und Optimierung der Notfallwiederherstellung über die Cloud

On-Premises Infrastructure Management and Cloud DR OptimizationDas Zweite, was Sie berücksichtigen müssen, ist die Optimierung aller verfügbaren Ressourcen. Dazu gehören sowohl Ihre Mitarbeiter als auch die von ihnen unterstützte Infrastruktur. Administratoren verwalten meist viele verschiedene Arten von Technologie, darunter verschiedene Arten von Speicher, Netzwerkausrüstung, Anwendungen und alles dazwischen. Es ist wichtig zu ermitteln, wie schwierig es ist, eine Lösung zu pflegen und zu erweitern, und ob ein Administrator seine Ziele mit minimalem Aufwand und minimaler Aufsicht erreichen kann.

Mit Swarm kann ein Teilzeitadministrator mit allgemeinem IT-Wissen über 100 Petabyte an Daten mit der zugehörigen Infrastruktur verwalten. Dies wird durch Funktionen wie dem Swarm Health Processor ermöglicht, der die manuelle Infrastrukturverwaltung praktisch eliminiert, indem er den Zustand der Objekte regelmäßig untersucht. Datenintegrität, Anzahl der Replikate, Datenparität durch Erasure Coding, Datenträgerkennungen usw. werden kontinuierlich überprüft. Auch die Lastverteilung und Speicherplatzrückgewinnung erfolgen automatisiert, sodass Hotspots vermieden werden und gleichzeitig eine optimale Auslastung der Hardware gewährleistet ist.

Swarm bietet auch die Möglichkeit, Daten für die Notfallwiederherstellung auf ein beliebiges S3-fähiges Gerät (wie ein Fujifilm-Objektarchiv) oder einen S3-fähigen Dienst (wie Amazon S3 Glacier oder Wasabi) zu replizieren. Dies erleichtert die Einhaltung von Unternehmensrichtlinien, die die externe Speicherung einer Kopie der Daten unabhängig von Ihrem Standort vorschreiben.

3. Richtlinienbasiertes Data Lifecycle Management

Policy-Driven Data Lifecycle ManagementAls Drittes müssen Sie berücksichtigen, dass sich zwar der Wert der Daten im Laufe der Zeit ändert, diese in der heutigen Welt aber trotzdem jederzeit zugänglich sein müssen. In Swarm verwalten Lifepoints automatisch die Speichernutzung und den Lebenszyklus der Daten. Lifepoints sind als Metadaten gespeicherte Richtlinien und Auslöser, die den Lebenszyklus von Inhalten von der Erstellung bis zum Verfall automatisch verwalten. Dazu gehören das Schutzschema, die Löschung und der Löschschutz. Sie können sicherstellen, dass die Daten vor böswilligen Angriffen geschützt sind, indem Sie sie in den ersten Monaten unveränderbar machen. Wechseln Sie von Replikation zu Erasure Coding, um die benötigte Kapazität erheblich zu reduzieren. Oder wechseln Sie von Erasure Coding zu Replikation, um die Dateileistung zu steigern. All dies erfolgt automatisch in der beim ersten Schreiben konfigurierten Weise.

4. Dezentrale Speicherverwaltung und Benachrichtigungen

Remote Storage Management and AlertingDer vierte Punkt, den es zu berücksichtigen gilt, ist die Art und Weise, wie ein Administrator eine schnell wachsende Speicherlösung von jedem Ort aus verwalten und einsehen kann. Wie die jüngsten Ereignisse gezeigt haben, können Sie möglicherweise nicht immer persönlich auf das Rechenzentrum zugreifen, wenn Sie extern arbeiten. Mit Swarm haben wir ein überaus reaktionsschnelles HTML5-basiertes Swarm Storage User Interface (UI) erstellt, das Sie von jedem gängigen Browser auf einem PC, Tablet oder Mobilgerät aus aufrufen können. Diese Schnittstelle bietet über ein Dashboard die Übersicht über den Zustand, Trendberichte für die Kapazitätsplanung, Betriebszähler und die Konfiguration dynamischer Einstellungen, ohne dass Simple Network Management Protocol (SNMP) erforderlich ist.

Remote Storage Management And Alerting

Neben dem Management-Dashboard bietet Swarm eine Reihe von Möglichkeiten, den Status Ihres Swarm-Clusters zu überwachen, unter anderem Phone-Home-Berichte, den detaillierten Systemstatus über SNMP und die Möglichkeit, detaillierte Systeminformationen über Prometheus zur Visualisierung mit Grafana und Benachrichtigung per E-Mail oder Slack zu exportieren.

5. Mandanten- und Content-Management

Tenant & Content ManagementDer fünfte Punkt ist die Art und Weise, wie Nutzer (Endnutzer oder Anwendungen) auf Speicherdienste und Daten zugreifen. Dies geht über die Sicherstellung der Einbindung in Identitätsmanagementlösungen hinaus. Administratoren müssen den Datenzugriff direkt von der Speicherebene aus verwalten und Endnutzern und Anwendungen die Möglichkeit einräumen können, bei Bedarf die benötigten Daten zu finden und abzurufen. Das Mandantenmanagement von Swarm umfasst die einfache Erstellung von Domains und Buckets sowie die Möglichkeit, Bandbreiten- und Kapazitätsgrenzen festzulegen. Darüber hinaus können Administratoren Datenschutzrichtlinien festlegen und die Authentifizierung und Autorisierung einfach über Active Directory, LDAP oder Token (S3, SAML/SSO 2,0) verwalten.

Swarm enthält auch eine Content-Management-Oberfläche für Administratoren und Endnutzer, die es Endnutzern ermöglicht, Daten hochzuladen, herunterzuladen und mithilfe anpassbarer Metadaten zu suchen, zu teilen, zu streamen und zu organisieren.

Nützliche Ressourcen

Bleiben Sie auf dem Laufenden

Melden Sie sich an, um sich die neuesten Artikel der Experten für Software-Defined Storage direkt an Ihre Mailbox liefern zu lassen.