Controllo dell'integrita dei dati - Un processo in 6 fasi
Introduzione all'integrita dei dati
Nel mondo odierno basato sui dati, le metriche vengono costantemente raccolte, estrate e utilizzate per prendere decisioni critiche. Molte aziende dipendono dai dati per ottenere informazioni dettagliate sulle loro operazioni, sullo stato finanziario e sui mercati. In effetti, uno studio di Sisense ha rilevato che il 55% delle aziende utilizza i dati per migliorare l'efficienza e prevedere i risultati.
Poiche grandi volumi di informazioni vengono compilati in modo coerente, le organizzazioni devono eseguire controlli di integrita dei dati. La conservazione e il mantenimento dell'integrita del database assicurano che le informazioni siano di alta qualita ed efficaci da utilizzare per le decisioni aziendali.
Che cos'e l'integrita dei dati?
L'integrita dei dati si riferisce all'autenticita, all'accuratezza e alla coerenza dei dati. Un modo per determinare se i dati di un'organizzazione hanno integrita consiste nell'esaminare la recuperabilita e l'accessibilita. E inoltre importante verificare se i dati sono tracciabili e affidabili. Per garantire che questi fattori vengano raggiunti, le organizzazioni spesso creano misure di sicurezza per l'integrita dei dati.
Esistono 4 tipi comuni di integrita dei dati che le aziende preserveranno.
1. Integrita entita
In genere, un database avra colonne, righe e tabelle. L'integrita dell'entita garantisce che ciascuno di questi elementi non sia mai identico, ne nullo. Con un valore di chiave primaria, gli utenti possono assicurarsi che ogni campo del database disponga di un identificatore univoco.
2. Integrita referenziale
L'integrita referenziale e quando i dati di due o piu tabelle dispongono di dati coerenti e accurati. Questo puo essere ottenuto assicurandosi che il valore della chiave esterna corrisponda ai valori nella chiave primaria.
3. Integrita del dominio
L'integrita del dominio si riferisce all'autenticita e all'accuratezza degli input in un database. Cio comporta la determinazione di un tipo di dati standard e il formato per una colonna. Ad esempio, un database puo richiedere che tutte le voci monetarie includano solo 1 decimale e nessuna virgola.
4. Integrita definita dall'utente
L'integrita definita dall'utente comporta regole create dall'utente per soddisfare le proprie esigenze. Spesso, entita, referenziale e integrita del dominio potrebbero non essere sufficienti per garantire l'accuratezza dei dati. Pertanto, gli utenti devono implementare le proprie esigenze.
Rischi di integrita dei dati
Secondo le statistiche, un'azienda media perde il 30% del suo fatturato annuo a causa della scarsa qualita dei dati. Di seguito sono riportate varie minacce che possono essere attribuite alla scarsa integrita dei dati.
- Errore umano
Gli errori umani possono spesso verificarsi involontariamente o dannosi. Questo avviene quando gli individui inseriscono informazioni imprecise, eliminano dati o duplicano le voci. Inoltre, l'integrita dei dati e compromessa quando gli utenti non seguono protocolli di immissione dati stabiliti o quando commettono errori di sicurezza.
- Errori nella trasmissione
- Malware e virus
- Hardware compromesso
Come preservare l'integrita dei dati
Per prevenire i rischi e preservare l'integrita dei dati, le organizzazioni devono implementare queste best practice.
1. Convalida input
Prima di elaborare qualsiasi set di dati, le organizzazioni devono eseguire la convalida dell'input. Le informazioni possono essere fornite da una fonte nota o da un'entita sconosciuta. Mentre queste entita possono essere utente finale o un altro sistema software, possono anche provenire da un individuo dannoso. Pertanto, la convalida verifichera che l'input sia corretto e affidabile.
2. Convalida dei dati
Una volta verificato l'input, i team aziendali devono convalidare i set di dati. Cio garantira che il processo dei dati non sia danneggiato e che le metriche in entrata siano accurate. Si consiglia all'organizzazione di determinare le specifiche e gli attributi importanti dei dati per semplificare questo passaggio.
Ad esempio, un'azienda puo richiedere che tutti dati finanziari essere elaborati in dollari statunitensi. Stabilire questo requisito fin dall'inizio garantira che le metriche siano convalidate correttamente.
3. Rimuovi voci duplicate
A volte e possibile accedere alle informazioni riservate provenienti da un database in documenti pubblici, fogli di calcolo o file condivisi online. I team aziendali devono rimuovere tempestivamente le fonti duplicate di dati per impedire l'accesso non autorizzato.
4. Eseguire backup regolari
Il backup regolare dei dati evitera la perdita accidentale dei dati e le alterazioni involontarie. Assicura inoltre che le organizzazioni disponano di una copia originale di tutti i dati in caso di attacchi informatici e minacce.
5. Controllo dell'accesso
Tutti i sistemi di database devono disporre di sistemi di sicurezza per impedire agli hacker e agli utenti non autorizzati di accedere alle informazioni. Queste persone possono compromettere l'integrita dei dati e condividere informazioni sensibili con il pubblico. Le applicazioni software dovrebbero avere una forma di controllo degli accessi per la sicurezza dei dati, come password e autenticazione a due fattori. I sistemi hardware devono essere fissati a pavimento o parete per evitare furti.
6. Avere un Audit Trail
Nel caso in cui si verifichi una violazione dei dati, le organizzazioni devono eseguire un audit trail per i controlli di integrita. Cio consentira ai team di individuare la causa della minaccia e prevenire compromessi per l'integrita dei dati in futuro.
In genere, un audit trail include il monitoraggio di ogni evento relativo ai dati, ad esempio quando le metriche sono state create, eliminate, lette e modificate. Gli audit comportano anche l'identificazione dell'utente che ha effettuato l'accesso al sistema e quando.