“Maneggia” i tuoi dati con Talend Open Studio
Integration-server Nessun Commento »In principio fu il file di testo, il nostro caro .txt che conteneva tutte le informazioni necessarie divise riga per riga. Poi ci si rese conto che era fondamentale fornire delle informazioni più strutturate e allora nacquero i database relazionali in grado di legare dati omogenei in maniera efficiente per poterli estrarre e consultare.
Con il passare del tempo, il proliferare dei formati ha permesso di trovarne sempre più specifici e sempre più mirati per determinati scopi ma ha anche creato un grosso problema di integrazione. Al giorno d’oggi bisogna fare i conti almeno con i seguenti formati:
- XML
- Excel
- CSV
- Flat file
- Tutti i possibili database presenti sul mercato
Messa così sembra una situazione disperata, in realtà esiste una famiglia di prodotti pensata per risolvere questa problematica, sono gli Integration Server o per semplicità gli ETL (Extract, Transform & Load).
Lo scopo di questi software è di permettere di estrarre i dati da un formato generico in input, applicarne delle trasformazioni (siano esse manipolazioni del dato in ingresso o filtri su di esso) ed infine salvare il risulato in uno specifico formato in output.
In questa prima scorribanda nel mondo degli ETL, ci occuperemo di un prodotto Open Source della Talend, Open Studio.
Il software è disponibile per Windows e per Linux, sia sotto forma di codice sorgente che di binari precompilati e la sua installazione è molto semplice non richiedendo nessuna interazione con l’utente.


Recent Comments