Deduplizierung

From SEPsesam
Revision as of 11:49, 14 May 2019 by Kad (talk | contribs)
Other languages:

Copyright © SEP AG 1999-2024. Alle Rechte vorbehalten.

Jede Form der Reproduktion der Inhalte dieses Benutzerhandbuches, ganz oder in Teilen, ist nur mit der ausdrücklichen schriftlichen Erlaubnis der SEP AG gestattet. Bei der Erstellung dieses Benutzerhandbuches wurde mit größtmöglicher Sorgfalt gearbeitet, um korrekte und fehlerfreie Informationen bereit stellen zu können. Trotzdem kann die SEP AG keine Gewähr für die Richtigkeit der Inhalte dieses Benutzerhandbuches übernehmen.

Docs latest icon.png Willkommen in der aktuellsten Version der SEP sesam Dokumentation 4.4.3/4.4.3 Grolar. Frühere Versionen der Dokumentation finden Sie hier: Dokumentation Archiv.


Übersicht

Wenn ähnliche Systeme auf demselben Speichergerät gesichert werden, besteht die Möglichkeit zur Redundanz innerhalb der gesicherten Daten. Ein Datenspeicher muss jedoch nur eine Kopie der Dateien enthalten, um sie rücksichern zu können.

Deduplizierung ist eine Datenkompressionstechnik, die redundante Blöcke eliminiert und somit die Größe der gesicherten Daten reduziert, indem sie keine doppelten Daten sichert, was zu einer Reduzierung des benötigten Speicherplatzes führt. SEP sesam wendet die Deduplizierungstechnik auf Blockebene an und bietet einen Hybrid aus sowohl zielbasierter (Si3T) als auch quellbasierter Deduplizierung (Si3S), um die bestmöglichen sicherungseffizienten Szenarien für verschiedene Umgebungen bereitzustellen. Beide Verfahren erfordern einen konfigurierten Si3 Deduplication Store, für den eine spezielle Lizenz erforderlich ist. Siehe Lizenzübersicht für Details.

Seit V4.4.3 Tigon ist es möglich den Si3 Deduplication Store zu verschlüsseln. Details finden Sie hier Verschlüsselung des Si3 Deduplication Stores.

Si3 zielbasierte Deduplizierung (Si3T)

Si3T ist eine Block-Level-Inline-Daten-Deduplizierungs-Lösung, die Daten direkt vom SEP sesam Server oder Remote Device Server auf die Sicherungsmedien schreibt. Sicherungen werden während des Schreibvorgangs auf das Speicherziel dedupliziert. Da die Datenredundanzen unvermindert über das Netzwerk übertragen und direkt am Ziel dedupliziert werden, erhöht sich die Netzwerklast, die Speichereinsparungen sind jedoch enorm.
SEP sesam analysiert die Datenblöcke und erkennt, ob die Daten einzigartig oder bereits im Si3 Repository vorhanden sind. Nur die einzigartigen Blöcke, die noch nicht gespeichert wurden, werden zum Repository geschickt, während die doppelten mit einem Stub-Objekt ersetzt werden. Dieses Stub-Objekt zeigt auf das Repository und wird zum Abrufen gespeicherter Daten verwendet. Siehe Konfiguration eines Si3 Deduplication Store für Details.

Quellseitige Deduplizierung (Si3S)

Si3S wurde mit SEP sesam Version 4.4.3 eingeführt. Quellseitige Deduplizierung bedeutet, dass Daten dedupliziert werden, bevor sie über das Netzwerk gesendet werden, wodurch die Sicherung extrem bandbreiteneffizient ist. Während der Sicherung berechnet SEP sesam Hashes von Daten, die von dem Client gesichert werden sollen und überträgt dann nur geänderte oder unbekannte Blöcke zu den Si3 Deduplications Store auf dem Sicherungsserver. Siehe Konfiguration quellseitiger Deduplizierung für Details.

Was funktioniert am besten?

Information sign.png Anmerkung
Wenn Sie Ihre Deduplizierungsmethode wählen, um redundante Sicherungsdaten zu eliminieren, analysieren Sie sorgfältig Ihre bestehende Infrastruktur, Netzwerkbeschränkungen und die Art der Daten, die Sie sichern möchten.
  • Typischerweise ist die quellseitige Deduplizierung gut geeignet für Umgebungen mit einer geringen LAN/WAN-Bandbreite und weniger Datenmengen. Ein weiterer typischer quellseitiger Deduplizierungsfall ist die Sicherung von Remote Data (ROBO) - zum Schutz und zur Speicherung der von Remote- und Zweigstellen erstellten Daten.
  • Andererseits könnte die zielbasierte Deduplizierung besser für große Datensätze in einem schnellen Netzwerk geeignet sein, wie beispielsweise strukturierte Datenbanken, die das Datenvolumen erheblich reduzieren müssen, oder für Daten auf Clients, für die Sie den CPU-Overhead nicht erhöhen wollen.
  • Sie sollten sich über die Einschränkungen der Deduplizierung im Klaren sein, bevor Sie diese konfigurieren. So ist es beispielsweise nicht sinnvoll, bestimmte Daten, wie beispielsweise Mediendateien, zu deduplizieren, die nicht aktiv dedupliziert werden können, da die Dateien eindeutig sind und in komprimierten Medienformaten vorliegen. Dazu gehören MP3, MP4, JPEG, PNG, gezippte Dateien etc.
  • Für verschiedene Datentypen sollten unterschiedliche Deduplizierungsrichtlinien und -verfahren eingerichtet werden. Z.B. Datenbanken in den einen Si3, und Pfadsicherungen in den anderen Si3 Store

Die Si3-Deduplizierung kann zusammen mit der Si3 Replication verwendet werden, um Sicherungsredundanz für die Notfallwiederherstellung bereitzustellen und die über das Netzwerk übertragenen Daten zu reduzieren. Seit V.4.4.3. Tigon ist es möglich, mit Hilfe von (Erst-)Befüllung einen neuen Si3 Deduplication Store zum Zwecke der Replikation einzurichten. Für Details, siehe (Erst-)Befüllung eines Si3 Deduplication Store.

SEP Tip.png Hinweis
Sie können sich das SEP Tachometer herunterladen, um die Struktur Ihrer Daten zu analysieren und das mögliche Einsparpotential mit der SEP sesam Si3 Deduplizierung auszurechnen. Siehe SEP Tachometer.

Wie geht's weiter?

Si3 Deduplication Hardware AnforderungenKonfiguration eines Si3 Deduplication StoreKonfiguration einer quellseitigen Deduplizierung – ReplicationReplication

Siehe auch

SEP TachometerLizenzübersicht(Erst-)Befüllung eines Si3 Deduplication StoreVerschlüsselung des Si3 Deduplication Stores