Data Mining: una palla di vetro al posto di montagne di dati

Maps Group
Maps Group

Otto anni fa iniziava l’avventura del blog #6MEMES, un luogo di conversazione tra tematiche tecnico-scientifiche e temi considerati di tipo umanistico, ispirato alle Lezioni Americane di Calvino.

In questi otto anni molto è cambiato e in maniera sostanziale: la cultura dei dati e del digitale è ormai dominante e i relativi settori di riferimento – comprese le contaminazioni culturali che li riguardano – sono diventati di dominio comune.

Per questo, nel 2022, il progetto #6MEMES ha raggiunto il suo traguardo e salutato i lettori.

Per continuare a seguirci, visita la sezione News e collegati ai nostri canali social:

Un tempo c’erano gli oracoli, i tarocchi, i riti scaramantici e le visionarie profezie di uomini e donne illuminati spesso da tragici destini.
Poi sono arrivate le teorie del gioco – che gioco tanto non è – e i loro dati statistici, che ci hanno insegnato come le probabilità possano divenire possibilità.
Oggi le carte che abbiamo in mano, in termini anche predittivi, sono ben altre, e derivano da cumuli e depositi di dati – espressi in testi, numeri, immagini e tutto ciò che è informazione allo stato puro – che, se giocati nel modo giusto, nei giusti tempi e con i passaggi opportuni, possono permetterci non solo di comprendere meglio il presente, ma di “predire” il futuro.

Di cosa stiamo parlando? Dei processi cosiddetti di “data mining”, ovvero di tutte quelle attività di scansione, analisi ed estrazione di dati per lo più insignificanti e irrilevanti attraverso delle griglie o dei percorsi interpretativi, che li contestualizzano e utilizzano secondo inediti e imprevisti percorsi di senso. Questi processi sono in grado, dopo tale lavorazione, di rappresentare vere e proprie proiezioni di dati nel futuro, con conseguenze non solo operative, ma anche riflessive ed auto-riflessive.

Ma cosa fanno di preciso questi processi di selezione dei dati? Come si muovono all’interno del trattamento cui sono sottoposti? Occorre innanzitutto partire da una capacità tutta umana, quella di porsi le giuste domande.
È l’interrogativo iniziale, infatti, che dà il via alla ricerca del campo d’azione, magari a sua volta ispirato dalla scoperta di una vera e propria “miniera” di dati, anche intercettata per caso.
Una volta compreso il tesoro potenziale che sta alla base di tale giacimento di dati, tutto è nelle mani del “data scientist”, ovvero quella figura professionale in grado di estrapolare valore concreto da una mole quasi inimmaginabile di informazioni del tutto prive di appeal e senso, per lo meno all’apparenza.
Che potrebbe ad esempio, all’interno di uno scenario inquietante come la mole di effrazioni denunciate in un determinato territorio, trattare, filtrare e associare tali dati in maniera proficua tra loro, rivelando in anticipo quali zone di una città saranno più probabilmente oggetto di tali spiacevoli attenzioni, e per quali tipologie di reato.

È il caso ad esempio di Transcrime, che “ha dimostrato come una parte dei furti in abitazione possa essere prevista partendo dall’analisi dei dati disponibili”.
Come è stato possible arrivare a questo risultato sorprendente? Rispondiamo a questa domanda con le parole dei relatori del progetto: “La ricerca – è stato osservato – ha da prima evidenziato caratteristiche e andamenti dei furti in abitazione in tutta Italia utilizzando i dati fino a dicembre 2014. Poi ha utilizzato un approccio innovativo per sviluppare un modello preventivo testato su tre città italiane (Milano, Roma e Bari) per dimostrare come pochi luoghi critici concentrino un numero considerevole di reati”.
Si tratta quindi di una capacità predittiva non trascurabile, capace di attingere le proprie radici in un’analisi del pregresso che si articola e riverbera in successive elaborazioni di Dati attraverso passaggi  complessi e articolati, in grado di “proiettare” tali inferenze in un contesto futuro, immaginandone i possibili scenari.
Caratteristiche, queste, comuni anche a Gzoom, l’innovativo sistema di analisi in grado di effettuare la medesima tipologia di inferenza su un tema altrettanto delicato: il potenziale corruttivo nascosto all’interno di un’organizzazione sottoposta a forti pressioni di questo tipo da parte del proprio contesto socio-economico.

Certo, tali “predizioni” non saranno mai sicure al 100%, e il margine d’errore esiste sempre. Anche gli oracoli più celebri, del resto, si esprimono spesso in profezie intellegibili.
Ma tutto ha inizio – e sempre lo avrà – dai medesimi, intramontabili interrogativi: Chi siamo? Da dove veniamo? E soprattutto: dove stiamo andando? La risposta, in questo caso, sarà… data!