Cosa è Datalabs Analysis
Datalabs Analysis è il modulo di Datalabs dedicato a Data Scientist e utenti che necessitano di effettuare analisi ed elaborazione sui dati tramite il lancio di elaborazioni batch.
Il modulo offre agli utenti diverse funzionalità:
- la possibilità di lavorare su ambienti di lavoro segregati e preconfigurati chiamati environment,
- utilizzare le proprie librerie e/o moduli per scrivere codice in maniera più facile e performante,
- schedulare i diversi workflow in modo che possano essere eseguiti batch e richiamabili tramite API.
Documentazione PySpark
È possibile fare riferimento al seguente link per la documentazione di Spark e relative API PySpark: Spark 2.4.0