Raccogli il Dato e mettilo da parte. Dalla digitalizzazione alla datizzazione.

Maps Group
Maps Group

Otto anni fa iniziava l’avventura del blog #6MEMES, un luogo di conversazione tra tematiche tecnico-scientifiche e temi considerati di tipo umanistico, ispirato alle Lezioni Americane di Calvino.

In questi otto anni molto è cambiato e in maniera sostanziale: la cultura dei dati e del digitale è ormai dominante e i relativi settori di riferimento – comprese le contaminazioni culturali che li riguardano – sono diventati di dominio comune.

Per questo, nel 2022, il progetto #6MEMES ha raggiunto il suo traguardo e salutato i lettori.

Per continuare a seguirci, visita la sezione News e collegati ai nostri canali social:

In uno dei nostri articoli precedenti, Big data e Shahrazàd: mille e un dato”, abbiamo parlato della possibilità di raccogliere, analizzare e utilizzare i dati come della fine di un percorso che fatalmente ne apre un altro, richiamando concetti quali ciclicità, replicabilità e serialità.

E con una similitudine delle nostre – rievocando il Sultano delle “Mille e una Notte”– abbiamo messo l’accento su un dato di fatto: “Nel mondo dei Dati (…) il passaggio tra la fine di una cosa e l’inizio di un’altra è assai meno cruento: qui davvero niente si distrugge ma tutto – potremmo dire in parafrasi – si moltiplica, trasformandosi.
I dati, proprio come varianti di una storia, mattoncini di un’infrastruttura o molecole di atomi differenti, possono dare vita, grazie ai diversi legami che si possono intrecciare tra loro o con qualcos’altro, a un numero pressoché inesauribile di altri tracciati informativi.”

Per proseguire ora il discorso e cercare di capire cosa avviene prima e dopo tale limina, facciamo riferimento alla tassonomia proposta dall’indice del libro “Big data. Una rivoluzione che trasformerà il nostro modo di vivere, di Mayer-Schönberger Viktor e Cukier Kenneth N., che illustra procedimenti di raccolta, analisi e riuso dei Dati che attraversano più limine, più soglie.

Come in tutti i processi successivi, infatti, tali dati – ancor prima di essere analizzati, filtrati e riorganizzati – seguono percorsi di trattamento differenti, ma tutti con la medesima finalità: trasformare dati disomogenei e di varia natura, assieme ai loro contenuti, in dati comparabili tra loro, certo, ma solo per andare oltre, in un’attività affatto nuova.

Sottolineiamo infatti come l’inizio del processo di “registrazione”, raccolta ed elaborazioni delle informazioni da parte degli esseri umani, corrisponde di fatto al superamento della linea di demarcazione tra società primitive e società avanzate.

Tutta la nostra evoluzione, in fondo, non è altro che questo, pur con drammatiche cadute ed errori anche d’interpretazione: cercare di decifrare la realtà in cui siamo immersi, non solo per garantire la nostra sopravvivenza, ma anche per dare una risposta alla nostra innata necessità di conoscenza.
Oggi, tale processo di estrapolazione, allocazione e riuso delle informazioni, avviene su larghissima scala attraverso quello che viene definito processo di Datizzazione, volto, per citare Mayer-Schönberger Viktor e Cukier Kenneth, N., aquantificare il mondo”.

In tale processo – che, ricordiamolo, è altra cosa rispetto alla digitalizzazione, attività con cui le informazioni si convertono in codici binari affinché possano essere processati dai computer – sono innumerevoli le fonti da cui attingere, in pressoché illimitate forme, trasformando tutto – anche le parole, le immagini, le geo-localizzazioni e le interazioni – in Dati.

Più in specifico, tornando al tema dei Big Data, tale processo di conoscenza, catalogazione, analisi e ri-aggregazione delle informazioni, si può effettuare a partire da due macro-tipologie di Dati, quelli diciamo così “sedimentati” – Data Mining, e quelli invece “in azione” – Data Driven.

Ed è importante mettere a fuoco come, da una materia prima all’apparenza così differente – in una serie successiva di attività cicliche, replicabili e serializzabili – si possano estrarre da entrambe le tipologie di dati informazioni da un lato “pulsanti” e per niente cristallizzate (nel loro potenziale significato) e dall’altro “stabili” e attendibili nella loro capacità in potenza di rappresentare o predire ulteriori evenienze.

Una caratteristica dei dati sedimentati, infatti, è sì quella di essersi stratificati nel tempo, e tuttavia la loro natura si presta all’azione, là dove la scintilla di una domanda, una ricerca o un’analisi può accendere tali dati, movimentandoli e infine estrapolandoli in informazioni complesse capaci di raccontarci ben di più della loro semplice storia.

Alcuni esempi di dataset in cui rintracciare tali dati (DATA MINING):

database con i nostri dati personali;
cataloghi di prodotto;
librerie online;
dati bancari e finanziari;
dati produttivi;
dati clinici;
dati di vendita;
dati su review.

Allo stesso modo i dati raccolti nei flussi in cui sono immersi, se guardati attraverso la lente in real time di un Grande Fratello appositamente istruito, catturano, rappresentano e rilasciano modelli e dati aggregati, che si muovono nell’insieme in cui dispiegano i loro (potenziali) significati, e attraverso tali informazioni si può arrivare a conclusioni e informazioni capaci di durare nel tempo e costituire base solida di partenza per altre esplorazioni.

Alcuni esempi di flussi di dati (DATA DRIVEN) in cui agire in real time:

tutte le comunicazioni che avvengono sui Social;
informazioni sui consumi in tempo reale di materie prime (energia, acqua, gas…);
dati relativi ai trasporti e alla movimentazioni di persone e merci;
dati relativi alle telecomunicazioni;
dati relativi al clima e alle condizioni dell’ambiente;

Basta insomma “grattare” appena sotto la superficie all’apparenza fredda e opaca di questa materia per trovarsi immersi in un oceano – o meglio in un Data Lake – nelle cui acque possiamo raccogliere e convertire ogni sostanza in “essenza”. Alla ricerca mai compiuta di risposte concrete anche alle nostre domande all’apparenza più immateriali.