Cosa è ed a cosa serve la profilazione degli utenti?

Grazie ai touch point digitali oggi è possibile raccogliere tantissimi dati sui singoli utenti/clienti, dati che poi possono essere tramutati in informazioni che permettono di conoscere meglio il proprio pubblico.

Queste analisi sono volte a creare dei segmenti omogenei di utenti/clienti a seconda dei criteri guida scelti come, l’età anagrafica, la frequenza d’acquisto, i contenuti più letti, la tipologia di bisogno, ecc.

Questo articolato processo prende il nome di profilazione e consiste nell’insieme delle attività di raccolta ed elaborazione dei dati inerenti agli utenti di un servizio o di un sito, al fine di suddividerli in gruppi con caratteristiche comuni (segmentazione).

Online, la profilazione dell’utente, permette di fornire servizi e contenuti personalizzati e/o l’erogazione di pubblicità mirata.

Le modalità di raccolta dei dati possono essere convenzionali come questionari e/o moduli cartacei o online (con domande, checkbox, risposte libere, …) o più moderne e native online, come il monitoring (registrazione) di usi, abitudini o comportamenti dell’utente, utilizzando ad esempio i cookie di profilazione, il cui compito è proprio quello di registrare le attività dell’utente al fine di raccogliere dati che possano consentire al titolare del trattamento, di effettuare la profilazione (profiling) ed eventualmente la segmentazione (clustering).

I cookie di profilazione, così come tutte le attività di click-monitoring implementabili all’interno di un sito o di una app, sono alla base del successo di colossi come Google, Amazon o Netflix in quanto consentono loro di effettuare tutte le elaborazioni necessarie per offrire ad ogni singolo utente la miglior experience di consumo, grazie a contenuti altamente personalizzati e mirati.

Nella attuale società dell’informazione, l’elaborazione dei tantissimi dati raccolti avviene di norma attraverso l’uso di algoritmi automatizzati che analizzano i dati allo scopo di estrarre una serie di caratteristiche/informazioni, che permettono di costruire un’offerta e servizi personalizzati e mirati.

Questi algoritmi lavorano in base a una serie di parametri che consentono loro di effettuare delle POC (Presumably Optimal Choices), ovvero di stimare le scelte presumibilmente ottimali (SPO in italiano) dell’utente oggetto dell’analisi.

Negli anni compresi tra il 2001 e il 2008 i pionieri della profilazione come Google, Youtube e Amazon hanno realizzato ed iniziato ad utilizzare i primi algoritmi automatizzati, che erano in grado di applicare solo un principio di causa-effetto: l’utente si stima abbia una certa disponibilità economica e cerca un vestito, sarà quindi presumibilmente propenso a comprare vestiti di un certo tipo e quindi sarà più efficace mostrargli messaggi pubblicitari che promuovono vestiti di quel tipo.

Con il tempo gli algoritmi e le capacità di analisi dei dati si sono enormemente evolute grazie all’utilizzo del machine-learning prima e dell’intelligenza artificiale poi e basandosi su parametri variabili nel tempo, oggi sono potenzialmente in grado di effettuare delle vere e proprie deduzioni sulla base dei dati raccolti: l’utente che ha comunicato di avere una certa disponibilità economica e che cerca abiti e cravatte sarà presumibilmente propenso ad acquistare anche camicie e scarpe di lusso, gemelli, ecc., nonché (presumibilmente) automobili sportive, orologi di lusso e così via.

Gli algoritmi – soprattutto il secondo, quello più evoluto – possono effettuare elaborazioni enormemente più efficaci nel momento in cui, anziché limitarsi all’analisi del set di dati e/o comportamenti di un singolo individuo, hanno la possibilità di incrociare i dati di un ampio numero di utenti: in altre parole, di analizzare i percorsi comportamentali che si verificano con maggior frequenza e riproporli, opportunamente declinati, per una tipologia di utenza con caratteristiche simili.

In tal modo, l’algoritmo può determinare che l’utente, che ha comunicato di avere una certa disponibilità economica ed ha acquistato uno smartphone, sarà presumibilmente propenso ad acquistare o consultare anche qualcos’altro che si trova all’interno del percorso comportamentale di una percentuale rilevante degli utenti aventi le sue stesse caratteristiche.

Questo processo di segmentazione è detto clustering, ed ha lo scopo di ricondurre un numero potenzialmente infinito di individui/utenti all’interno di un numero definito di categorie, o per meglio dire di percorsi comportamentali, al fine di determinare nel migliore dei modi le Presumably Optimal Choices di ciascun utente.

Prescindendo dalla complessità e dalla granularità dell’algoritmo, è evidente che questo tipo di attività di correlazione si basano sempre e comunque su un elevato livello di approssimazione basato sui grandi numeri, che tende a semplificare enormemente la realtà.

Nel caso di colossi come Google, Amazon, Netflix, Whatsapp o Facebook, si tratta di un processo di standardizzazione dell’utente o meglio di enormi quantitativi di utenti provenienti da tutto il mondo, all’interno di determinate categorie liquide e mutevoli nel corso del tempo, che rischiano così di far “perdere” le specifiche caratteristiche, peculiarità e identità originali dei singoli utenti.

Le elaborazioni, in particolar modo quelle derivanti da grandi volumi (“big data profiling”) sono in grado di generare nuove informazioni, non rilevate, ma frutto delle deduzioni probabilistiche dell’algoritmo stesso, come il fatto che a un utente presumibilmente piacciano le cravatte di lusso sulla base dei suoi percorsi di navigazione incrociati con quelli di migliaia di altri utenti.

Queste informazioni non rilevate, ma dedotte, sono dette “shadow data” e normalmente esistono senza che gli utenti ne abbiano consapevolezza.

L’attività di profilazione è considerata da alcuni invasiva e se gestita scorrettamente potrebbe anche portare a danni o abusi a carico degli utenti a causa di forme di diseguaglianza sociale e discriminazione.

Alcune categorie di persone, infatti, potrebbero non essere mai raggiunte da alcuni contenuti o offerte, determinando forme di “isolamento” e discriminazione del tutto ingiustificate e per questo motivo il regolamento europeo prevede un apposito obbligo di informazione sulle modalità di profilazione.

Il GDPR è stato pensato per tutelare l’individuo non soltanto nella consapevolezza legata all’esistenza dei suoi dati personali, ma anche e soprattutto sulle modalità di trattamento degli stessi.

Dall’atro canto i dati personali, la profinazione, ecc., se utilizzati con etica e nel rispetto degli interessi degli utenti, migliorano l’exprience, l’utilità ed il ritorno online per gli unteti stessi.

Migliorano la produzione e la distribuzione delle informazioni online, fornendo ad ognuno una selezione di contenuti e servizi “su misura”, adatti alle proprie esigenze e preferenze.

Massimo P. Colombo