Qu'est-ce que la cartographie des donnees? Definition et guide pour les entreprises
Introduction a la cartographie des donnees
A mesure que les entreprises prennent de l'expansion, beaucoup doivent transferer leurs donnees des systemes obsoletes vers de nouveaux logiciels. Cependant, ce n'est pas aussi facile que cela en a l'air. Pour s'assurer que les donnees sont sures et completes, les entreprises doivent effectuer la cartographie des donnees. Avec les outils de mappage des donnees, les organisations decrivent l'itineraire que les donnees doivent emprunter pour passer de leur origine a la destination finale.
Qu'est-ce que la cartographie des donnees?
Le mappage des donnees est le processus necessaire pour faire correspondre les champs de donnees entre les solutions avant la migration. Pour integrer les technologies, toutes les informations doivent etre exactes et normalisees. Dans le cas contraire, les entreprises disposent d'une importante compilation d'informations jumelees, ce qui rend impossible la determination de l'ensemble de donnees correct.
Les entreprises collectent continuellement des donnees provenant de sources multiples pour compiler une base de donnees etendue. Il en resulte generalement des ensembles de donnees de differents formats qui rendent impossible l'agregation des informations dans des rapports a des fins d'analyse. Sans donnees traitees, les entreprises ne sont pas en mesure de developper des informations exploitables.
C'est pourquoi les entreprises ont besoin d'un outil de cartographie des donnees pour consolider et assembler les informations provenant de plusieurs systemes en une seule interface. L'integration devient necessaire a mesure que les entreprises se developpent et adoptent davantage de technologies. Les organisations qui ne parviennent pas a connecter des systemes peuvent rencontrer des jeux de donnees fragmentes, errones et dupliques.
Quand le mappage des donnees est-il necessaire?
Generalement, les entreprises utilisent le mappage des donnees avant integration de donnees , la transformation et la migration.
Integration des donnees
L'integration des donnees est le processus de collecte et d'agregation de grands volumes de Big Data dans un seul entrepot pour faciliter la navigation. A cette fin, la cartographie des donnees relie les sources de donnees et definit les dependances pour illustrer le schema technologique.
Pour commencer, les developpeurs doivent analyser le cours d'origine et l'infrastructure applicative pour s'assurer qu'ils peuvent s'integrer aux autres informations. Par exemple, les gestionnaires doivent determiner quelles informations se recoupent entre le logiciel de point de vente (PDV) et le logiciel de gestion des stocks dans les magasins de detail.
Ensuite, les entreprises peuvent etablir des filtres et des criteres en fonction de leurs exigences en matiere de donnees de gestion. Cela peut inclure le choix d'un systeme par defaut lorsque l'integrateur systeme detecte des jeux de donnees conflictuels pour determiner le logiciel prefere. Apres avoir cartographie tous les systemes, les entreprises peuvent integrer les solutions existantes et construire un paysage robuste.
Transformation des donnees
La transformation des donnees se refere a la traduction des donnees d'un format a un autre afin de les placer dans une nouvelle structure. Ce processus de cartographie est essentiel pour deplacer des jeux de donnees entre des entrepots ou des applications ayant des exigences de structure differentes. La transformation des donnees comprend les elements suivants.
- Conversion de type
- Elimination des doublons
- Enrichissement des donnees
- Agregation
Afin de transformer les donnees, les developpeurs doivent d'abord cartographier le format dans lequel les informations sont traduites.
Migration des donnees
La migration de donnees est le deplacement d'informations d'un emplacement a un autre. Encore une fois, ce processus necessite le mappage des donnees, sinon il peut perdre des champs de donnees en cours de route. En cartographiant le trajet en premier, les entreprises ont egalement la possibilite d'automatiser la migration plutot que de deplacer manuellement des donnees importantes. Les methodes traditionnelles de migration des donnees se sont averees accroitre le risque d'erreur humaine et de divergences.
3 techniques de cartographie des donnees
Alors que les entreprises devaient a l'origine s'appuyer sur la cartographie manuelle des donnees d'entreprise, les nouvelles technologies ont rendu possible le schema et la cartographie automatisee.
Mappage manuel des donnees
Pendant le mappage manuel des donnees, les developpeurs codez a la main chaque connexion entre les sources de donnees au schema final. Generalement, les codes sont en XTSL (Extensible Stylesheet Language), qui est un programme qui traduit les rapports XML vers d'autres formats.
Cependant, le codage manuel devient impossible a mesure que les solutions se developpent et continuent de s'integrer a d'autres systemes. Une fois le reseau trop etendu, les entreprises doivent passer au schema ou a la methode de cartographie automatisee.
Mappage de schema
La cartographie des schemas est un processus partiellement automatise qui utilise un logiciel pour classer des structures similaires, reduisant ainsi le besoin d'intervention humaine. La solution de cartographie analyse les origines des donnees cibles afin d'etablir des connexions entre les sources. Ensuite, le developpeur doit verifier la precision et l'assurance qualite de la carte avant que le logiciel ne genere les codes de lancement definitifs.
Mappage automatique
La cartographie entierement automatisee utilise un logiciel pour permettre aux developpeurs de glisser-deposer des avatars des sources numeriques pour creer un paysage. La plupart des solutions de cartographie ont differentes entites qui permettent differents formats de donnees sur une carte. Avec un logiciel de cartographie automatisee, les entreprises peuvent generer des cartes de donnees technologiques sans aucune experience de codage.
Etapes de mappage des donnees
Les entreprises peuvent effectuer la cartographie des donnees en seulement sept etapes completes.
1. Definir
Les gestionnaires doivent definir les donnees avant de les transmettre a un autre emplacement. Cela inclut des informations dans des tables, des champs et des formats differents. Pour l'integration, les entreprises doivent egalement specifier le mode de transfert entre les sources de donnees.
2. Carte
Apres avoir defini les donnees, les developpeurs peuvent cartographier les origines, la normalisation des formats et les destinations finales.
3. Transformer
A ce stade, les developpeurs attribuent un code a n'importe quel champ de donnees necessitant une transformation.
4. Test
Testez le systeme et quelques champs de donnees pour vous assurer que le transfert est reussi et precis.
5. Deployer
Si le systeme n'a pas besoin d'autres ajustements, le service informatique peut planifier la migration ou l'integration finales.
6. Maintenir
Apres le deploiement de l'evenement, les developpeurs doivent surveiller le systeme pour corriger les connexions perdues et maintenir le flux de donnees.
7. Mise a jour
Les entreprises devraient verifier aupres de leurs fournisseurs pour determiner a quel moment le systeme doit faire l'objet d'une mise a jour.