File system parallelo ad alta velocità
Gestione dei dati basata su policy
Namespace globale unificato
Consolida i silos di storage
Scalabilità trasparente
Nessun lock-in dei vendor né tasse sui dati
L'innovazione ad alta intensità di dati richiede molto di più della semplice potenza di calcolo. Che si tratti di eseguire complesse simulazioni, addestrare modelli di deep learning o elaborare dati ad alta risoluzione, le prestazioni dipendono dalla velocità e dall'efficienza con cui i dati possono essere spostati.
Gli ambienti HPC e AI sono progettati per la velocità, ma le architetture di storage tradizionali spesso diventano un collo di bottiglia. Mentre le CPU e le GPU continuano a diventare sempre più veloci, le infrastrutture di dati legacy si basano su tier frammentati e gestiti manualmente che semplicemente non possono tenere lo stesso passo della capacità di calcolo. Il risultato? Rallentamenti della pipeline, risorse sottoutilizzate e perdite di tempo.
Lo storage temporaneo (scratch) si riempie rapidamente di file non gestiti. I dati sono sparsi in silos diversi, difficili da trovare e costosi da mantenere su storage veloce.
Senza automazione, i team si ritrovano a rincorrere i file, richiamare manualmente i set di dati e intervenire di continuo per mantenere le prestazioni sotto controllo.
- Le GPU sono inattive in attesa del caricamento dei dati?
- Lo storage scratch continua a riempirsi di file che non vengono mai spostati?
- Spostamento e richiamo dei dati tra i vari livelli di storage vengono gestiti manualmente?
- Il team fatica a gestire set di dati distribuiti tra più sistemi o sedi?
- I costi continuano ad aumentare perché i dati "freddi" rimangono su storage ad alte prestazioni?
- Si utilizza il cloud bursting o la sua integrazione è ancora troppo complicata?
Elimina i colli di bottiglia con uno scratch storage tier-0 ad alta velocità
Nei flussi di lavoro HPC e AI, lo storage scratch Tier-0 è il punto in cui i dati si spostano più velocemente, o almeno dovrebbero. Troppo spesso, però, diventa un collo di bottiglia per le prestazioni, rallentato da file inutili, vincoli di capienza o limiti di I/O.
DataCore Nexus mette a disposizione un file system parallelo software-defined ad alte prestazioni, creato appositamente per gli ambienti HPC e AI più esigenti. Progettato per tenere il passo con la moderna velocità di calcolo, offre latenza ultra-bassa e throughput costante, anche su larga scala e fino al 99% della capienza.
Con prestazioni in lettura fino a 180 GB/s in un compatto fattore di forma 4U, Nexus mantiene le GPU e le CPU continuamente alimentate, evita interruzioni nei processi e mantiene lo storage scratch sempre pronto alle nuove sfide.
Nexus sfrutta l'infrastruttura basata su NVMe e supporta l'accesso POSIX, NVMe-oF, NFS e SMB per offrire I/O a latenza ultra bassa in tutta la pipeline di elaborazione. È progettato per ambienti di scala petabyte e funziona senza lock-in proprietari né costi aggiuntivi legati ai formati, offrendo prestazioni senza compromessi.
Automatizza il ciclo di vita dei dati con l'orchestrazione basata su policy
Negli ambienti ad alte prestazioni, i dati non restano mai fermi. Fluiscono dal Tier-0 scratch alle home directory, dai set di dati attivi agli archivi profondi, dai sistemi on-premise al cloud. Ma gestire manualmente questo ciclo di vita rallenta ogni operazione.
Nexus automatizza questo processo con un'orchestrazione intelligente e basata su policy. I file si spostano tra i tier in base all’utilizzo in tempo reale, alle esigenze del progetto o ai trigger dei flussi di lavoro senza interventi manuali, senza script personalizzati, senza sorprese.
Hai bisogno di eseguire automaticamente l'offload dei dati obsoleti dallo scratch? Di precaricare i file di input per un processo pianificato? Di richiamare in modo trasparente i set di dati archiviati nel momento in cui vi si accede? Nexus lo rende possibile, in modo che i dati siano sempre nel posto giusto, al momento giusto, senza interrompere i flussi di lavoro.
Il risultato: un’infrastruttura più snella, uno spazio scratch più ordinato, meno complessità operativa e più tempo dedicato a ricerca, sviluppo e risultati.
Semplifica la collaborazione con un namespace globale unificato
Quando i set di dati sono distribuiti tra sistemi, sedi o tipologie di storage diverse, la collaborazione rallenta drasticamente. Ricercatori, ingegneri e analisti perdono tempo a inseguire i file, ad attendere i trasferimenti o a duplicare i dati tra i team, il tutto con il rischio di conflitti di versione e risultati incoerenti.
Nexus rimuove queste barriere con un namespace globale unificato che riunisce tutti i dati non strutturati, indipendentemente da dove sono memorizzati: on-premise, nel cloud o in ambienti ibridi. Utenti e applicazioni accedono a una vista unica e coerente dei dati necessari, con controlli di accesso sicuri che rispettano la struttura organizzativa dell’azienda.
Che si stia supportando un progetto di ricerca globale, flussi di lavoro di training AI distribuiti o operazioni HPC multi-sito, Nexus garantisce che i dati siano sempre individuabili, accessibili e coerenti, ovunque ci si trovi, senza replica, riformattazione o complessità.
Scalabilità intelligente, senza complicazioni
Con l'aumento dei workload HPC e AI, lo storage deve scalare sia in termini di prestazioni che di flessibilità. DataCore Nexus si espande per supportare petabyte e miliardi di file senza interrompere i flussi di lavoro o rallentare l'elaborazione.
Inoltre, si connette in modo trasparente all'object storage, al nastro e al cloud, consentendo di gestire l'intero ecosistema di dati – su tutti i tier e in tutte le posizioni – come un unico ambiente integrato. E quando la domanda cresce improvvisamente, Nexus supporta il cloud bursting, fornendo i dati on-demand all'elaborazione cloud senza necessità di precaricamenti manuali o duplicazioni. Scali quando serve e riduci quando hai finito, mantenendo sempre controllo e visibilità.
I vantaggi principali
- Massimizza l'utilizzo di GPU e CPU mantenendo le pipeline di dati continuamente alimentate
- Accelera i tempi di ottenimento dei risultati con avvio dei job, checkpoint e output più rapidi
- Mantieni il tier-0 scratch pulito e performante con l'offload automatico dei dati
- Elimina lo spostamento manuale dei dati con l'orchestrazione basata su policy
- Abilita una collaborazione trasparente con l'accesso unificato tra sedi e team diversi
- Scala liberamente l'infrastruttura e lo storage senza interruzioni né necessità di rivedere l'architettura
- Supporta flussi di lavoro ibridi e cloud bursting senza creare silos di dati