La qualité des données est le processus de maintien de la cohérence et de la fiabilité des valeurs détenues dans le système informatique d’une entreprise. Une information qualitative répond à plusieurs critères comme la validité, la précision, la cohérence, la complétude et la mise à jour.
A l’inverse, la non-qualité des données représente l’absence de qualification de celles-ci. Elle regroupe l’indisponibilité, la non-conformité, la non-actualisation, la non-complétion et l’inexactitude des valeurs. On considère une information non-qualitative si elle est mal orthographiée, si elle comporte des doublons, ou encore si elle n’a pas été actualisée durant un certain temps.
Une mauvaise qualité des données résulte de l’intervention de divers facteurs. La cause principale de la mauvaise qualité des données est l'intervention humaine. Une erreur de saisie dans le système informatique, la duplication dans les différents services ou encore le déplacement en dehors des applications métiers font partie des erreurs les plus fréquentes lors du traitement des données.
Une mauvaise communication entre les équipes et l'absence d'un entrepôt de type datawarehouse peuvent amener à la création de doublons.Si une donnée est dupliquée, il est difficile de savoir quelle version est fiable.
Cependant, les erreurs menant à la non-qualité peuvent aussi être d’origine technique. Des problèmes de sécurité ou encore une mauvaise migration peuvent endommager les données. Les erreurs de transfert ainsi que la détérioration de la donnée lors de sa conversion dans un autre format peuvent être fatales.