Qu'est-ce que la gestion de la qualite des donnees? 5 piliers cles a savoir
Introduction a la gestion de la qualite des donnees
La collecte, l'organisation et le stockage des donnees ne representent que la moitie de la bataille de la gestion des donnees. Les informations laissees dans les bases de donnees peuvent se deteriorer avec le temps, perdant ainsi leur precision et leur valeur. Pour eviter cela, de nombreuses entreprises pratiquent la gestion de la qualite des donnees afin de preserver les informations et de maintenir la conformite avec les donnees normes de qualite .
Qu'est-ce que la gestion de la qualite des donnees?
La gestion de la qualite des donnees (DQM) consiste en des pratiques de maintenance visant a ameliorer la qualite de l'information. Le DQM s'etend de la collecte initiale des donnees jusqu'a la mise en oeuvre des solutions de gestion des donnees et a la distribution de l'information. Les entreprises reconnaissent le DQM comme un processus interne essentiel pour maintenir l'information a jour et fiable. Sinon, les donnees peuvent se deteriorer avec le temps, ce qui diminue la precision et l'impact des informations.
Aujourd'hui plus que jamais, les entreprises ont besoin de DQM car beaucoup ont plusieurs solutions, ce qui rend difficile la maintenance sans pratiques standardisees. En etablissant des processus DQM, les entreprises peuvent optimiser leurs bases de donnees, leurs methodes de collecte de donnees et leur maintenance. Cela garantit que tous les rapports, analyses et informations generes sont exacts et impactants.
Mesures pour la mesure de la qualite des donnees
La mesure de la qualite des donnees est essentielle pour les entreprises qui s'appuient sur des informations historiques et en temps reel pour prendre des decisions eclairees. Les entreprises ne sont pas en mesure d'evaluer objectivement leur niveau de performance sans DQM. Par consequent, les organisations doivent examiner les mesures cles qui determinent la qualite globale des ensembles de donnees.
Precision
L'exactitude des donnees fait reference au changement continu de statut au fur et a mesure que les entreprises cycle en information en temps reel. En d'autres termes, les informations les plus recentes remplacent les informations obsoletes pour fournir les details les plus precis. Les entreprises peuvent mesurer l'exactitude des donnees au moyen d'une documentation et de methodes de verification exhaustives pour s'assurer que les renseignements sont comptabilises et exacts.
Les entreprises qui utilisent des logiciels de gestion peuvent suivre la precision en surveillant le rapport entre les donnees et les indicateurs de performance cles d'erreur (KPI). Cette mesure compte le nombre de champs de donnees manquants et errones et les compare a l'ensemble de donnees global. Les entreprises, bien sur, devraient s'efforcer de reduire les problemes de qualite, mais peuvent commencer par etablir un point de reference pour l'appetit pour le risque. En d'autres termes, les gestionnaires devraient determiner le nombre maximal d'erreurs qu'ils autoriseront dans les systemes.
Coherence
La coherence des donnees garantit la concordance des ensembles de donnees de tous les systemes, quel que soit leur origine. Par exemple, le profil d'un client doit contenir les memes informations personnelles dans les systemes de point de vente (PDV) et de gestion de la clientele. En cas de conflit de donnees, les entreprises ne peuvent pas dechiffrer quel jeu de donnees est correct.
Avec l'integration du systeme, les entreprises peuvent connecter tous leurs logiciels etablis pour creer une interface universelle. L'integration permet aux solutions de partager des donnees en temps reel entre elles afin d'assurer la coherence des donnees dans l'ensemble de l'entreprise. Cependant, il est important de differencier la coherence et la precision, car les jeux de donnees peuvent correspondre mais etre incorrects.
Exhaustivite
L'exhaustivite fait reference a l'integralite des donnees afin que les entreprises puissent tirer des conclusions globales et tirer des informations exploitables. Les entreprises peuvent mesurer l'exhaustivite des donnees en verifiant les entrees manquantes dans les champs. Encore une fois, les integrateurs de systemes peuvent extraire les donnees pertinentes d'autres sources pour remplir les formulaires et assurer leur exhaustivite.
Integrite
L'integrite des donnees, egalement appelee validation des donnees, consiste a tester des ensembles de donnees pour s'assurer que les entreprises respectent les politiques. Les reglementations specifiques de l'industrie obligent les entreprises a verifier l'exactitude des donnees et a utiliser certains formats. Par consequent, les organisations doivent demeurer conformes pour eviter les frais et autres penalites.
Pour mesurer l'integrite, les entreprises doivent surveiller le taux d'erreur de transformation des donnees. Cette mesure determine le nombre de fois ou les processus internes ne parviennent pas a reformater correctement les donnees lorsqu'elles se deplacent d'un emplacement a l'autre. Si ce taux continue d'augmenter, les entreprises devront peut-etre envisager de nouvelles methodes de conversion.
Rapidite
La rapidite des donnees fait reference a la disponibilite et a l'accessibilite de l'information a tout moment. En d'autres termes, c'est la difference entre le moment ou les entreprises attendent de l'information et le moment ou elles les recoivent reellement. Comme les entreprises s'appuient sur des donnees en temps reel pour ameliorer diverses strategies, elles doivent mesurer activement la rapidite d'execution.
La mesure tempore-valeur mesure la valeur des informations en fonction de leur actualite. Comme les entreprises preferent les donnees en temps reel, elles trouvent generalement les informations les plus recentes qui offrent le plus de valeur. Par consequent, les gestionnaires devraient s'efforcer d'etablir des systemes qui tirent les donnees rapidement et avec precision.
Les 5 piliers de la gestion de la qualite des donnees
En plus des diverses mesures de qualite des donnees, les entreprises devraient egalement tenir compte des cinq piliers de la reussite du DQM.
Le peuple
Bien que la technologie ait le pouvoir d'ameliorer considerablement le rendement des entreprises, elle n'est que aussi efficace que les personnes qui la controlent. Par consequent, si les employes n'ont pas les competences et les connaissances sur les fonctionnalites de la solution, l'entreprise n'optimisera pas ses operations. En creant une hierarchie d'employes, les organisations peuvent etablir des roles en fonction des competences, de l'experience et des capacites du travailleur.
- Gestionnaires DQM sont charges de superviser tous les efforts d'expansion de la veille economique. Par consequent, ils doivent rester a jour sur la portee du projet, le budget, les membres de l'equipe et la mise en oeuvre.
- Responsables du changement organisationn organiser et aider sur divers projets, de la creation de tableaux de bord logiciels a la generation de rapports.
- Analystes de donnees sont les abeilles occupees qui travaillent pour atteindre des objectifs fixes, tels que l'amelioration de la qualite des donnees, de l'actualite et de l'integrite. Ce sont les employes qui executent reellement les plans organises.
Profilage des donnees
Le profilage des donnees est un processus cyclique dans DQM qui se compose de quatre etapes.
1. Examiner en profondeur chaque ensemble de donnees.
2. Contre-interroger les donnees a ses metadonnees.
3. Test de modeles statistiques.
4. Generation de rapports sur la qualite globale des donnees.
Le processus de profilage des donnees est necessaire pour developper des informations et des rapports a partir des donnees. Sans ce processus, les entreprises ne peuvent garantir l'exactitude et l'exhaustivite de l'information.
Definition de la qualite des donnees
Le pilier qualite est centre sur ce que la qualite des donnees signifie specifiquement pour chaque entreprise. La definition de la qualite des donnees peut sembler tres differente entre les entreprises, car elles peuvent avoir differentes normes. Par exemple, certaines organisations peuvent avoir un appetit a risque eleve, ce qui permet plus d'ecarts de donnees que d'autres.
Cela depend generalement de l'industrie, de la concurrence et des clients de l'entreprise. A mesure que les marches fluctuent, la signification de la qualite des donnees peut egalement changer avec le temps. Par consequent, les entreprises devraient surveiller leur business intelligence et mettre a jour leur definition.
Rapports de donnees
Le quatrieme pilier de la DQM est la communication de donnees, qui consiste a eliminer et a rapporter toute donnee compromettante. En se fondant sur les normes de l'entreprise, les gestionnaires devraient identifier et consigner les ecarts entre chaque systeme individuel. Apres avoir consolide ces informations, la direction peut definir des variables communes pour developper des schemas. Cela permet a l'entreprise de mettre en oeuvre des mesures preventives.
Reparation des donnees
La reparation des donnees consiste a corriger les donnees et a mettre en oeuvre un nouveau systeme pour ameliorer l'exactitude des informations. Lorsqu'ils determinent la principale cause de donnees erronees, les gestionnaires doivent determiner pourquoi, ou et comment les donnees sont devenues defectueuses. Avec ces details, les developpeurs peuvent programmer des outils de qualite qui reparent les dysfonctionnements, evitant ainsi des erreurs similaires.