Introduzione ai Workflow: Versioning, Stati e Progetto
Un Workflow in Datalabs Analysis è un processo automatizzato che permette di eseguire una serie di operazioni sui dati in modo sequenziale o parallelo, facilitando l'analisi e l'elaborazione strutturata di grandi quantità di informazioni.
A cosa serve un workflow?
Un workflow viene utilizzato per definire e orchestrare una serie di passaggi necessari per trasformare, analizzare o estrarre valore dai dati. Questo processo può includere le seguenti attività:
- Acquisizione dei dati
- Pulizia dei dati
- Trasformazione dei dati
- Analisi dei dati
Concetti chiave
Di seguito è riportato un elenco di concetti chiave essenziali per una comprensione completa del workflow di analysis:
Versioni
Ogni workflow può avere diverse versioni che rappresentano le modifiche apportate nel tempo. Una nuova versione può essere creata quando si fanno cambiamenti significativi, come:
- L'aggiunta di nuovi step
- La modifica dei parametri
- L'aggiornamento dei codici di esecuzione
Questo approccio permette di tenere traccia di tutte le versioni create nel tempo. Ogni versione ha un numero univoco del tipo X.Y (es.: 1.1 o 2.3), che rende facile distinguerle e identificarle. In caso di problemi, è sempre possibile partire da una versione precedente, anche se ormai non più in uso, per creare una nuova versione aggiornata e funzionante.
Stati
Ogni versione di un workflow attraversa diversi stati durante il suo ciclo di vita:
Stato | Descrizione |
---|---|
Draft | La versione del workflow è in fase di sviluppo o modifica. |
Review | La versione del workflow è in fase di revisione per verificare la correttezza del codice e della logica. |
Released | La versione del workflow è stata approvata da un Utente Validator e rilasciata. |
Deprecated | La versione del workflow è stata scartata e non è più disponibile per validazione ed esecuzione. Può comunque essere consultata. |
Info
Solo una versione può essere in ciascuno stato attivo (al più una in stato Draft, Review, Released; da nessuna in su in stato Deprecated); le versioni più vecchie vengono deprecate man mano che ne vengono create di nuove.
Progetto
Un progetto è l'entità che raccoglie tutte le versioni e gli stati di un workflow specifico. Include informazioni come:
- Il nome del workflow
- Una descrizione opzionale
- Configurazioni rilevanti come il Datalake e la Business Island a cui il workflow è associato
Questi elementi configurativi definiscono l'ambiente e l'ambito in cui il workflow opera, ovvero quali dati vengono utilizzati e quale area di business è coinvolta.