Data Masking - Perchè e come fare il make-up dei tuoi dati...
Prepararsi per carnevale non è mai troppo tardi...
Mentre il database generalmente è tecnologicamente protetto e vi accedono solo le persone autorizzate, non si può dire lo stesso per le copie generate, per esempio, per il mondo del test, su richiesta di chi fa sviluppo applicativo, che devono necessariamente essere congruenti con i database originali". Per situazioni come queste è stato ideato il data masking, ovvero una tecnica di pseudonimizzazione che consiste nel nascondere i dati sensibili originali, reali, con dati alternativi casuali, fittizi; Martini sottolinea l'importanza di gestire la sostituzione in modo congruente: "Se per esempio devo cambiare il nome di una persona, devo sostituire in modo pertinente anche il codice fiscale della stessa, in modo che non emerga nell'utilizzo della copia alcuna incongruenza". Come spiega il manager, un progetto di mascheramento implica dunque l'analisi delle informazioni che si stanno trattando e la generazione di un preciso processo che rende corretto ed efficace il mascheramento: è proprio in virtù di questa necessità d'ordine che il data masking porta all'azienda vantaggi importanti, al di là della compliance, tra cui la pulizia dei dati superflui, causa di problemi di sicurezza e di un inutile sovraccarico delle infrastrutture, che si traduce poi in costi per l'ampliamento delle stesse che potrebbero invece essere evitati.
Da un punto di vista pratico, questo obiettivo può essere ottenuto attraverso l'applicazione di diverse tecniche sostanzialmente raggruppabili in due famiglie: la prima è la randomizzazione, che modifica il grado di verità del dato al fine di eliminare la correlazione che esiste tra lo stesso e la persona. Tecniche che rientrano in questa categoria sono la permutazione, l'aggiunta di rumore statistico e la differential privacy. La generalizzazione rappresenta la seconda famiglia di tecniche di anonimizzazione e consiste nel diluire gli attributi delle persone interessate modificandone la rispettiva scala o ordine di grandezza. Si pensi ad esempio all'indicazione di una fascia d'età anziché all'età precisa del soggetto, o ancora della regione invece della città di residenza, e così via. Appartiene a questa famiglia, ad esempio, la promettente tecnica di "k-anonimato" con le sue varianti, per le quali molte metodologie sono già disponibili e applicabili.