Vai al contenuto

Introduzione ai Workflow: Versioning, Stati e Progetto

Un Workflow in Datalabs Analysis è un processo automatizzato che permette di eseguire una serie di operazioni sui dati in modo sequenziale o parallelo, facilitando l'analisi e l'elaborazione strutturata di grandi quantità di informazioni.


A cosa serve un workflow?

Un workflow viene utilizzato per definire e orchestrare una serie di passaggi necessari per trasformare, analizzare o estrarre valore dai dati. Questo processo può includere le seguenti attività:

  • Acquisizione dei dati
  • Pulizia dei dati
  • Trasformazione dei dati
  • Analisi dei dati

Concetti chiave

Di seguito è riportato un elenco di concetti chiave essenziali per una comprensione completa del workflow di analysis:


Versioni

Ogni workflow può avere diverse versioni che rappresentano le modifiche apportate nel tempo. Una nuova versione può essere creata quando si fanno cambiamenti significativi, come:

  • L'aggiunta di nuovi step
  • La modifica dei parametri
  • L'aggiornamento dei codici di esecuzione

Questo approccio permette di tenere traccia di tutte le versioni create nel tempo. Ogni versione ha un numero univoco del tipo X.Y (es.: 1.1 o 2.3), che rende facile distinguerle e identificarle. In caso di problemi, è sempre possibile partire da una versione precedente, anche se ormai non più in uso, per creare una nuova versione aggiornata e funzionante.


Stati

Ogni versione di un workflow attraversa diversi stati durante il suo ciclo di vita:

Stato Descrizione
Draft La versione del workflow è in fase di sviluppo o modifica.
Review La versione del workflow è in fase di revisione per verificare la correttezza del codice e della logica.
Released La versione del workflow è stata approvata da un Utente Validator e rilasciata.
Deprecated La versione del workflow è stata scartata e non è più disponibile per validazione ed esecuzione. Può comunque essere consultata.

Info

Solo una versione può essere in ciascuno stato attivo (al più una in stato Draft, Review, Released; da nessuna in su in stato Deprecated); le versioni più vecchie vengono deprecate man mano che ne vengono create di nuove.


Progetto

Un progetto è l'entità che raccoglie tutte le versioni e gli stati di un workflow specifico. Include informazioni come:

  • Il nome del workflow
  • Una descrizione opzionale
  • Configurazioni rilevanti come il Datalake e la Business Island a cui il workflow è associato

Questi elementi configurativi definiscono l'ambiente e l'ambito in cui il workflow opera, ovvero quali dati vengono utilizzati e quale area di business è coinvolta.