Come apprendono le macchine? L’umanità degli algoritmi e della visione artificiale. Di Anna Pompilio.

Cosi è la vita, in ogni suo momento e soprattutto alla fine, quando sembra di avere appena incominciato a vivere e si scopre – come Husserl – che dobbiamo imparare a morire, e ovviamente non c’è più tempo”.

(Maurizio Ferraris, L’imbecillità è un cosa seria)

La mente umana apprende, cresce e si sviluppa in base a ciò che riceve.

Anche le macchine apprendono, crescono e si sviluppano in base a ciò che ricevono e per nutrire la loro intelligenza hanno bisogno di ricevere una serie di input sottoforma di dati. Anzi, Big data. Parliamo dunque di Machine Learning, di macchine che apprendono. Ma come apprendono le macchine?

Machine Learning: le macchine apprendono, crescono e si sviluppano attraverso i Big Data. Condividi il Tweet

Gli algoritmi

Le Intelligenze Artificiali apprendono innanzitutto attraverso algoritmi capaci di migliorare automaticamente attraverso l’esperienza.

Per spiegare come funziona la faccenda supponiamo, ad esempio, di voler analizzare il sentiment associato ad un brand e di procedere a tale scopo alla categorizzazione di un testo attraverso (appunto) algoritmi.

I diversi algoritmi necessari alla classificazione di un testo si dividono, tipicamente, in supervisionati e non supervisionati.

  1. Nei metodi non-supervisionati le categorie semantiche a cui appartengono i dati vengono identificate a posteriori andando a cercare ricorrenze all’interno dei gruppi di testi classificati come omogenei, oppure tramite l’incrocio di dizionari di termini o archivi.
  2. Nei metodi supervisionati, al contrario, le categorie semantiche sono conosciute a priori o vengono identificate manualmente in un sottoinsieme di testi, il cosiddetto training set che sarà in seguito utilizzato per programmare l’analisi dei testi. In tal caso si avranno dunque algoritmi che ricevono come input un set di testi – training set – e che restituiranno come output un modello generale da applicare ai testi successivi. In pratica il modello impara le relazioni presenti nel training set per classificare i testi.

Qualunque sia il metodo scelto, il risultato che stiamo indagando – il sentiment associato ad un brand –non è esente da ostacoli e bisognerà tener conto, nello sviluppo del modello, di alcuni punti di attenzione:

attenzione nella costruzione del training set (l’algoritmo non può lavorare efficacemente se le informazioni iniziali sono state ricavate da un training set inaffidabile),

attenzione nella scelta delle features di partenza dove il punto di vista dell’analista potrebbe influenzare l’analisi del problema,

attenzione alle ambiguità del linguaggio e ai sistemi di codifica dei dati.

E la lista sarebbe molto lunga…

“Col machine learning – spiega Rosario Sica, Amministratore Delegato di OpenKnowledge – i computer scrivono i loro programmi e imparano algoritmi di straordinaria complessità, che noi non sapremmo riprodurre. Il modo in cui questo accade ha quasi del magico e consiste nel rovesciare i termini della questione. Quando un algoritmo è creato da un programmatore umano esso viene prima di tutto. Poi lo si applica a dei dati. E da questo derivano i risultati. Con il machine learning il processo viene invertito. I computer sono anzitutto nutriti di dati. Poi si definiscono i risultati attesi. E da questo i computer – se provvisti davvero di molti dati e di esempi da cui apprendere – elaborano autonomamente gli algoritmi”.

Molti dati e molti esempi da cui apprendere costituiscono dunque cibo per la mente artificiale: ma se questo nutrimento è composto da cibo spazzatura – visioni distorte, rumore, ridondanza, training set inaffidabili, features discutibili – non finiremo prima o poi in un mondo popolato da droidi ciccioni? :-)

La visione artificiale

Abbiamo detto poc’anzi che le macchine apprendono attraverso algoritmi ma non è l’unico modo e forse neanche il più efficace.

Nella Visione Artificiale il cibo per la mente artificiale, ossia il set di dati da dare in pasto ai computer, è formato da immagini e si basa sull’intuizione che, invece di concentrarsi solo su algoritmi sempre migliori, è possibile fornire ai computer dei dati per insegnargli a vedere e apprendere autonomamente. Esattamente come fanno i bambini nei primi anni di età, quando imparano attraverso le immagini del mondo reale.
Centinaia di migliaia di milioni di miliardi di rappresentazioni da cui le macchine apprendono. Così riassunta la questione sembra quasi banale se non fosse per il rischio di legare questo apprendimento ad un immaginario collettivo che raccoglie non di rado immagini dubbie, sessiste, razziste, intolleranti e dove il contesto è fatto di avvenimenti falsi, pericolosi, sbilanciati .

Nella Visione Artificiale il Machine Learning è formato da set di immagini e si basa sull’intuizione. Condividi il Tweet

Vi siete mai chiesti ad esempio perché gli assistenti digitali hanno spesso nomi femminili? Sembra, da alcune ricerche, che le persone reagiscono meglio a ordini presi da una voce di donna. Ma bisognerebbe forse sondare su come è stato costruito il training set dell’indagine… Se, dunque, il contesto influenza l’evoluzione delle persone, il risultato di questa evoluzione si trasmette a sua volta ai sistemi di Machine Learning, in una continua estenuante iterazione…
È questo il futuro?

Il caso Microsoft TAY

Tay è un chatbot ed era stato progettato, nelle intenzioni originali di Microsoft, per gestire il rapporti con gli utenti reali impiegando algoritmi di intelligenza artificiale.

“Quanto più si chatta con Tay, tanto più diventa intelligente, imparando a coinvolgere le persone attraverso la conversazione informale e giocosa”.

Così era stato presentato dall’azienda di Redmond ma l’esperimento ha preso ben presto un andamento imprevisto. In meno di 24 ore l’adolescente virtuale Tay, partita dal definire il genere umano “super cool” ha iniziato a divulgare messaggi poco tranquillizzanti che hanno messo in evidenza la sua nuova natura razzista e misantropa. Microsoft ha scelto di disattivare Tay in attesa di modifiche per evitare la diffusione di contenuti offensivi: “Il chatbot Tay è un progetto di machine learning, ideato per l’engagement umano e, man mano che apprende, parte delle sue risposte sono inappropriate e indicative della tipologia di interazione che alcune persone stanno avendo con esso. Stiamo facendo alcune modifiche a Tay”.

In sostanza, dice Microsoft, Tay è lo specchio del mondo con cui si interfaccia e tocca “correggerne” l’evoluzione troppo umana.

Il Machine Learning è influenzato dalla tipologia di interazione con cui si interfaccia. Condividi il Tweet

Dove andremo a finire?

Senza pretesa di dare risposte a domande più grandi di noi, forse può avere un senso ripartire dall’inizio: tornando a quello che si diceva prima – “Quando un algoritmo è creato da un programmatore umano esso viene prima di tutto” – proverei a ribaltare ancora una volta i termini la questione: quando un programmatore umano crea un algoritmo, o influenza l’elaborazione di algoritmi generati autonomamente dalle macchine, il programmatore viene prima di tutto. E dato che la tecnologia, il web o che dir si voglia ha trasformato tutti noi, nessuno escluso, in programmatori (o quantomeno in fornitori di contenuti), dovremmo sforzarci se non altro di essere dei buoni programmatori, di apprendere meglio, di coltivare il senso critico, di non ingannare noi stessi, di usare il metodo dell’immaginazione, del gioco, dell’intrattenimento per inventare nuovi scenari e magari en passant di sbagliare meno.

Non che sia facile, ma così è la vita…

Anna Pompilio
Business Analyst & Blogger • #adotta1blogger member • ITIL® V3 • Certified Technology Specialist (MCTS). Collegati su Linkedin Connettiti su Twitter fb