Les données jouent aujourd’hui plus que jamais un rôle essentiel dans la plupart des activités. Pourtant, de très nombreuses entreprises ont tendance à enfermer leurs données en silos cloisonnés. Leurs architectures rendent très souvent des données potentiellement très utiles inaccessibles.
Conséquences, les entreprises n’utilisent qu’une infime partie des données produites et récoltées. Elles en tirent peu, voire aucun avantage concret. Les données doivent pouvoir être accessibles, manipulables et exploitables facilement pour apporter de la valeur à une entreprise. Ces opérations exigent des processus ETL.
Le terme ETL « Extract, Transform, Load », désigne une série d’opérations liées aux données : Extraction, Transformation, Chargement. L’ETL est donc un processus en 3 étapes permettant :
- d’extraire des données brutes de sources multiples,
- de les préparer en les transformant pour utilisation
- de les envoyer vers un serveur, une base ou un entrepôt de données.
L’ETL agit donc au début de la chaîne de production des données.