Cerca
Lingue
<

Deduplica e compressione dei dati

Risparmia sullo storage evitando di sovraccaricarlo e liberando spazio su disco occupato da dati ridondanti

Una crescita dei dati non controllata porta spesso a un rapido esaurimento della capienza di storage. Questo fa sì che i team IT continuino ad aggiungere hardware, con conseguenti costi ed eccesso di risorse non necessarie. I data set duplicati sono un elemento chiave del problema. Alcuni di essi possono potenzialmente essere compressi, ma vengono invece memorizzati con le dimensioni originali occupando più spazio su disco. Un'efficace ottimizzazione della capienza di storage può aiutare a vincere queste sfide.

software-defined storage DataCore SANsymphony software-defined storage due tecniche di riduzione dei dati per l'ottimizzazione della capacità. La deduplicazione dei dati elimina i dati ridondanti. La compressione riduce lo spazio necessario per l'archiviazione dei dati. Entrambe le tecniche prevengono la perdita di dati, garantendo sempre l'integrità degli stessi.

Che cos’è la deduplicazione e la compressione?

deduplicaDeduplicazione analizza i blocchi di dati e genera un hash univoco per ciascun blocco di dati. Se un nuovo blocco che viene scritto su disco presenta lo stesso valore hash di un blocco già esistente, verrà sostituito con un identificatore che rimanda semplicemente al blocco di dati già esistente.

Più copie ridondanti dei dati possono essere sostituite con riferimenti a una singola copia, riducendo così la capienza necessaria.

La deduplica offre i vantaggi maggiori quando ci sono più blocchi degli stessi dati, creati per esempio dalla ridondanza delle snapshot o delle immagini VDI.

deduplicaCompressione, è un processo algoritmico che riduce la dimensione dei dati individuando innanzitutto le sequenze identiche che compaiono in successione, per poi salvare solo la prima sequenza e sostituire le sequenze identiche successive con l'informazione relativa al numero di volte in cui compaiono in successione.

Poiché solo la prima sequenza di dati viene memorizzata così com'è, per rappresentare nuovamente le stesse informazioni serve meno spazio su disco. Il livello di compressione dipende in genere dalla natura del data set stesso, che deve essere comprimibile almeno parzialmente.

I benefici di deduplica e compressione

  • Requisiti di spazio su disco ridotti che portano a un'allocazione ottimizzata dello storage
  • Maggiori risparmi sui costi IT e aumento del ROI
  • Minore ingombro dell'hardware, con una riduzione di spazio occupato e requisiti energetici più contenuti
  • Maggiore efficienza dello storage

Due approcci a deduplica e compressione dei dati

DataCore SANsymphony mette a disposizione due approcci per realizzare la deduplica e la compressione sullo storage. È possibile scegliere l'approccio appropriato in base ai requisiti aziendali e IT.

Deduplicazione e compressione in linea: in questo caso, la riduzione dei dati avviene prima che questi vengano scritti su disco. SANsymphony e analizza i dati in entrata alla ricerca di potenziali opportunità di ottimizzazione ed esegue la deduplicazione e la compressione. L’elaborazione in linea riduce i requisiti di capacità del disco, poiché i dati vengono deduplicati e compressi prima di essere archiviati. Quando si eseguono frequenti operazioni di backup e la quantità di dati ridondanti generati è elevata, l’elaborazione in linea rappresenta l’approccio consigliato, poiché riduce le dimensioni dei dati prima dell’archiviazione del backup.

La deduplicazione e la compressione in linea sono supportate solo nelle edizioni EN e BR di SANsymphony possono essere abilitate singolarmente o insieme (deduplicazione, compressione o entrambe) a seconda delle esigenze.

Deduplicazione e compressione post-elaborazione: in questo caso, la riduzione dei dati avviene dopo che questi sono stati scritti su disco. SANsymphony memorizza SANsymphony i dati grezzi nel dispositivo di archiviazione di destinazione. Successivamente, i dati memorizzati vengono scansionati e analizzati per individuare opportunità di ottimizzazione. I dati deduplicati e compressi vengono riscritti sul dispositivo di archiviazione, che ora occupa meno spazio rispetto a prima. È importante notare che l’allocazione iniziale di capacità sul dispositivo di destinazione è maggiore con la deduplicazione post-elaborazione, poiché i dati grezzi vengono prima archiviati così come sono prima di essere sottoposti alla riduzione. La deduplicazione post-elaborazione consente di pianificare l’ottimizzazione della capacità nelle ore non di punta, riducendo così al minimo l’impatto sugli IOPS durante le ore di picco.

La deduplicazione e la compressione post-elaborazione sono supportate nelle edizioni EN, ST e BR di SANsymphony. Confronta SANsymphony .

infografica su deduplica e compressione dei dati inline e post-process

Deduplica e compressione dei dati inline e post-process utilizzando SANsymphony

Sono molti i fattori che influiscono sull’efficienza e sul rendimento della deduplicazione e della compressione: il tipo di dati, la frequenza delle modifiche apportate ai dati, la frequenza di accesso, la frequenza dei backup, ecc. Esistono alcuni carichi di lavoro che, per loro natura, eliminano già una certa quantità di ridondanza a livello di applicazione, determinando così rapporti di deduplicazione e compressione inferiori. Esistono poi altri carichi di lavoro, come la VDI, che presentano più copie della stessa immagine del sistema operativo e che, al momento del backup, generano rapporti di deduplicazione e compressione più elevati. I tipi di file che più probabilmente traggono vantaggio dalla deduplicazione e dalla compressione contengono blocchi di dati ripetitivi, con contenuti relativamente statici e a cui si accede raramente. Sia le tecniche di ottimizzazione della capacità in linea che quelle di post-elaborazione aiutano i team IT a ottenere risparmi sui costi di investimento (CAPEX). I risparmi effettivi dipendono dall’efficienza delle operazioni di deduplicazione e compressione e dai rispettivi rapporti di ottimizzazione della capacità.

Inizia la tua prova gratuita: fai girare SANsymphony nel tuo ambiente IT. Si installa in pochi minuti.