Quando enormi set di dati, infrastrutture frammentate e workload ad alta velocità di trasmissione dati si scontrano, mettono a dura prova i sistemi di storage tradizionali. E questo è particolarmente vero per gli ambienti con un'elevata quantità di dati, come l'AI, l'HPC, i media e la ricerca, dove la gestione del flusso di dati tra tier, siti e cloud diventa un enorme collo di bottiglia.
Ngenea risolve questo problema inserendo automazione intelligente tra le applicazioni e i livelli di storage. Unifica lo storage eterogeneo in un namespace globale, consente un tiering trasparente e orchestra le azioni del ciclo di vita senza interrompere i flussi di lavoro o compromettere le prestazioni. Se utilizzato insieme a DataCore Pixstor, Ngenea migliora le sue capacità con la mobilità intelligente dei dati, estendendo il file system ad alte prestazioni in un data fabric dinamico e basato su policy.
- Estende lo storage esistente con l'orchestrazione; niente soluzioni usa e getta
 - Come target, supporta file, object e cloud: NAS, S3, nastro e altro ancora
 - Crea un namespace globale con stubbing dei file per un accesso ai dati trasparente
 - Automatizza posizionamento, richiamo, migrazione e archiviazione dei dati
 - Si integra con gli scheduler di processo e i flussi di lavoro ibridi
 - Consente la sincronizzazione e il recupero dei dati tra sedi diverse
 - Fornisce l'indicizzazione completa dei metadati e il controllo basato su API
 - Deployment on-premise, nel cloud o in ambienti ibridi
 
Casi d'uso
Ambienti HPC ibridi che richiedono uno spostamento trasparente dei dati tra tier di calcolo, scratch e archivio
Pipeline di addestramento di modelli AI che richiedono ingestione rapida dei dati, pre-staging e archiviazione dei checkpoint
Flussi di lavoro multimediali che richiedono uno spostamento continuo dei dati tra i tier di produzione, rendering, archiviazione e cloud
Collaborazione globale con accesso remoto ai dati tramite una vista unificata e richiamo intelligente delle informazioni
Cloud bursting e DR con caching intelligente, prefetch e trasferimento dei dati a costi ottimizzati
Team multi-sede con accesso distribuito ai dati e governance completa del ciclo di vita
Funzionalità
Ngenea astrae tutto lo storage in un'unica vista logica, eliminando i silos e consentendo il tiering e il richiamo automatizzati e basati su policy tra tier e posizioni diverse.
- Namespace basato su stub con richiamo trasparente all'accesso
 - Spostamento dei dati basato su policy in base a età, percorso, tag, accesso, utilizzo
 - Tiering tra NVMe, SSD, HDD, object, nastro, cloud, NAS
 - Idratazione dei file on-demand o prefetch tramite integrazione con scheduler di processo
 - Mantiene i metadati, le autorizzazioni e i percorsi originali
 - Funziona con storage legacy tramite stubbing inverso
 - Non è necessaria alcuna riconfigurazione di app o utenti
 
Automatizza lo spostamento dei dati tra livelli di prestazioni e capienza in base all'utilizzo reale, alle policy e ai flussi di lavoro senza influire sull'accesso o interrompere i percorsi.
- Tiering basato su regole per età, dimensioni, proprietario, posizione, tag o attività
 - Spostamento trasparente dei dati tra NVMe, SSD, HDD, object, nastro e cloud
 - Mantiene percorsi dei file, autorizzazioni e metadati
 - Richiamo (idratazione) dei file on-demand o basato su policy in base alle esigenze
 - Si integra con i gestori di flussi di lavoro e gli scheduler dei processi
 - Lo stubbing inverso consente l'accesso ai dati legacy, riducendo la migrazione
 - Allinea il tiering agli obiettivi di prestazioni, costi e conservazione dei dati
 - Controllo granulare per scenari di staging, archiviazione o bursting
 - Gli strumenti di analisi della capienza forniscono informazioni dettagliate sui modelli di utilizzo per pianificare le decisioni di tiering in modo più efficace
 
Ngenea tiene traccia dei metadati e li indicizza su tutto lo storage connesso, fornendo visibilità e fruibilità complete indipendentemente dalla posizione fisica.
- Indice centrale di nomi di file, percorsi, tag, marche temporali
 - Supporta metadati standard e personalizzati, migliorando la ricercabilità e la visibilità dei dati
 - Accesso GUI e API per cercare, filtrare e recuperare i risultati
 - Proxy di anteprima disponibili per dati archiviati o "freddi"
 - Integrato con Pixstor Search e pipeline esterne
 - Esporta i risultati della ricerca in flussi di lavoro operativi
 
Ngenea accelera spostamento e replica tra ambienti diversi senza la complessità dei trasferimenti manuali o di un'infrastruttura dedicata.
- Sincronizzazione efficiente con impatti minimi
 - Opzioni di sincronizzazione bidirezionale e disidratata (solo stub)
 - Supporta tipologie di sincronizzazione POSIX↔POSIX, POSIX↔S3 ed S3↔S3
 - Trasferimenti ottimizzati in base alla larghezza di banda e controllo per singolo percorso
 - Reverse recall ottimizzato per il DR: recupera solo ciò che serve
 - Può migrare miliardi di file con facilità
 
Ngenea si integra con i flussi di lavoro computazionali per automatizzare le azioni di preparazione, staging e post-elaborazione dei dati.
- API REST e Python per trigger pre/post job
 - Supporta le toolchain Slurm, Portable Batch System (PBS) e CI/CD
 - Trigger basati su file ed eventi per un'automazione completa
 - Carica i dati nell’area di scratch prima dell’esecuzione di un processo e li archivia al termine
 - Modello di action cart per la movimentazione o la pulizia pianificata
 
Ngenea garantisce un accesso sicuro e vincolato alle policy in tutti i tier e le posizioni, senza influire sulla produttività degli utenti.
- Controllo degli accessi basato su ruoli (RBAC) a tutti i livelli
 - Supporta l'autenticazione AD, LDAP, OAuth2
 - Registrazione di audit per gli eventi di richiamo, spostamento e accesso ai dati
 - Applicazione delle politiche di conservazione tramite snapshot e policy di tiering
 - Crittografia in transito (TLS/SSH) e, opzionalmente, at rest
 - Regole specifiche del sito, limiti di richiamo e disponibilità del DR
 
Ngenea garantisce visibilità completa sui dati – dalla dashboard al controllo programmatico – mostrando dove si trovano, come vengono utilizzati e quali costi generano.
- Dashboard centralizzata per lo stato delle policy, la coda di recall e l’utilizzo
 - Raccolta e registrazione di eventi e log di sistema tramite Logstash ed Elasticsearch
 - Avvisi via e-mail per soglie critiche ed eventi di sistema
 - Automazioni predefinite per le azioni legate al ciclo di vita e alle policy
 - REST API per l'integrazione e l'orchestrazione
 - Trigger personalizzati per ingestione, sincronizzazione, migrazione e DR
 
Ngenea estende l’orchestrazione a qualsiasi destinazione — dal cloud hyperscale all’archiviazione a lungo termine, fino ai siti di ingestione distribuiti all’edge.
- Si integra con AWS, Azure, GCP e object store privati
 - Si integra con DataCore Swarm per l'archiviazione S3 on-premise
 - Supporta il nastro tramite BlackPearl e il NAS tramite NFS/S3
 - Richiamo trasparente basato su stub e indicizzazione su tutti i target
 - Caching e archiviazione in cloud controllati da policy
 - Tiering basato su policy in funzione di costi, utilizzo o flussi di lavoro
 - Supporta ambienti ibridi e multi-cloud
 
Benefici
Automatizza le cose complesse
- Pianifica e attiva i flussi di lavoro sui dati tramite regole e policy, senza intervento manuale
 - Orchestra i dati dall’ingestione all’archiviazione senza interrompere l’attività degli utenti
 - Riduce il sovraccarico operativo tra le diverse sedi
 
Ottimizza posizionamento e costi dei dati
- Garantisce che i dati "caldi" rimangano su uno storage veloce; archivia automaticamente i dati "freddi"
 - Applica policy basate sui costi per evitare spese cloud impreviste
 - Sfrutta i sistemi di storage esistenti ed espandi liberamente l’infrastruttura con l’hardware che preferisci: nessun lock-in imposto dai vendor
 
Abilita la collaborazione globale
- I team remoti lavorano come un’unica squadra attraverso un namespace unificato
 - L’accesso tramite stub garantisce che i file siano sempre individuabili
 - I dati vengono richiamati su richiesta o precaricati in base alle necessità
 - L'accesso basato sui ruoli garantisce che gli utenti vedano solo ciò di cui hanno bisogno
 
Accelera i workload
- I dati sono dove devono essere anche prima dell'inizio dei processi di calcolo
 - Precarica, memorizza in cache e idrata i dati senza ritardi
 - Semplifica i flussi di lavoro dal core all'edge, fino al cloud
 
Protegge & ripristina con precisione
- DR basato su stub con footprint ridotto
 - Sincronizzazione e richiamo basati su policy tra tier di storage e siti diversi
 - Ripristino rapido senza replica completa del set di dati
 
Rende la strategia di storage a prova di futuro
- Integrazione semplificata di nuovo hardware, storage o siti
 - Esegue il tiering su cloud o nastro senza interrompere i flussi di lavoro
 - Scala operatività e sedi senza dover reinventare i meccanismi di accesso
 
Architettura
Architettura di riferimento DataCore Ngenea e Pixstor per ambienti HPC/AI
Deployment
Il deployment di Ngenea e Pixstor può essere realizzato on-premise, nel cloud o come soluzione ibrida, offrendo la flessibilità necessaria per supportare qualsiasi flusso di lavoro o strategia infrastrutturale.
 
Licensing
Ngenea è concesso in licenza in base al numero di server. Una singola licenza consente lo spostamento dei dati su un qualsiasi numero di destinazioni di storage — tra cui scratch, home, archivio e cloud — senza limiti di capienza e senza costi basati sulle prestazioni. In questo modo si eliminano i costi nascosti, si evitano tariffe basate sulla capienza man mano che il namespace si espande ed è possibile disattivare o riutilizzare l'hardware senza incorrere in costi di licenza aggiuntivi. Ngenea è disponibile esclusivamente in abbinamento a Pixstor.

