Ritorno al futuro: alla ricerca delle origini dei motori di ricerca

Maps Group
Maps Group

Otto anni fa iniziava l’avventura del blog #6MEMES, un luogo di conversazione tra tematiche tecnico-scientifiche e temi considerati di tipo umanistico, ispirato alle Lezioni Americane di Calvino.

In questi otto anni molto è cambiato e in maniera sostanziale: la cultura dei dati e del digitale è ormai dominante e i relativi settori di riferimento – comprese le contaminazioni culturali che li riguardano – sono diventati di dominio comune.

Per questo, nel 2022, il progetto #6MEMES ha raggiunto il suo traguardo e salutato i lettori.

Per continuare a seguirci, visita la sezione News e collegati ai nostri canali social:

Abituati a cercare online siti di ogni tipo, parole-chiave tra le più strane e informazioni delle più disparate, non tutti conosciamo la storia della tecnologia che sta alla base di tali, sterminate possibilità di ricerca, quella dei “motori di ricerca”, appunto. Uno per tutti Google.

Questo, nonostante siamo in moltissimi ad avvantaggiarcene – sia per gli aspetti personali della nostra vita che per le nostre attività professionali – e nonostante tale tecnologia sia diventata un paradigma in grado di generarne di nuove.

Facciamo allora un passo indietro, alla ricerca (anche noi) di queste informazioni perdute, e cerchiamo di mettere in fila – là dove è possibile – i punti salienti di questo racconto, assieme ai suoi principali protagonisti.

Come prima cosa occorre risalire alla nascita della rete vera e propria, quella di Internet.

Correva l’anno 1991, al CERN di Ginevra, il 6 di agosto, quando Tim Berners-Lee, informatico britannico, e il suo collega, Robert Cailliau, pubblicarono su Internet il primo sito Web mai realizzato al mondo: quello del centro di ricerca per il quale entrambi lavoravano. Il sito era stato progettato sulla base del concetto di hypertext, inteso come insieme di documenti messi in relazione tra loro per mezzo di parole chiave. Nasceva così il Web, ovvero il “World Wide Web”, come venne battezzato da Berners-Lee.

Utilizzata inizialmente solo dalla comunità scientifica, la tecnologia alla base del web viene resa pubblica il 30 aprile 1993 proprio dal CERN: da quel momento in poi – grazie alla notevole mole di informazioni che viaggiavano attraverso la rete – cominciarono a nascere i primi archivi, con il fine di rendere consultabili tali dati da tutti gli interessati in qualsiasi momento.

Una realtà, questa, immaginata nel lontano 1945 da uno dei pionieri dell’informatica e degli ipertesti: Vannevar Bush, che aveva già da allora ipotizzato la necessità di un sistema in grado di gestire cui una grande mole di informazioni, «continuamente estesa, conservata ma soprattutto consultabile».

Il World Wide Web, dunque, inizia a ospitare milioni e milioni di documenti, e si candida naturalmente a svolgere la funzione di archivio per eccellenza. Accade così che nei centri di ricerca dei più importanti Atenei universitari si cercano di mettere a punto nuovi metodi di archiviazione e di consultazione che siano all’altezza di una tale mole di dati.
Vengono dati alla luce i primi motori di ricerca, in tecnichese “spider” o “crawler”, in grado di leggere e catalogare i documenti all’interno del “world wide web” rendendoli disponibili agli utenti nelle cosiddette “SERP” (Search Engine Result Page), le pagine in cui sono visibili uno dopo l’altro i risultati forniti dai motori di ricerca in base alle “query” (domande) poste alla rete.

Il primo embrione di questa tecnologia risale al 1990, si chiama Archie ed è stato creato da uno studente canadese della McGill University of Montreal, Alan Emtage. (Archie, per essere precisi, fu un motore di ricerca per gli archivi di documenti distribuiti con il protocollo FTP, e non per il world wide web. Ci sembrava però corretto citare questo come il progenitore dei motori di ricerca.).

Nonostante alcuni suoi punti deboli – tra cui il fatto che l’utente poteva interrogarlo solo se conosceva perfettamente il nome del file da trovare (tra gli allora 2,6 milioni circa di documenti archiviati), Archie attirò su di sé la curiosità e le attenzioni di molti studiosi, che a loro volta avviarono numerose ricerche su come registrare e rendere disponibili i documenti su internet in maniera agevole e rapida. E, a furia di cercare, qualcuno iniziò finalmente ad avvicinarsi sempre di più allo strumento di ricerca perfetto, secondo le sue necessità.

Da qui in poi le tappe si susseguono in una vera e propria evoluzione, come riportato di seguito in un breve, non esaustivo elenco.

separatore

1993
Aliweb (Archie Like Indexing on teh Web) viene creato da Martij Koster sulla scia di Archie, e ha come obiettivo la raccolta di tutti i siti presenti sul web. La grande innovazione che porta con sé è la possibilità, per ogni singolo utente, di inviare l’indirizzo del proprio sito, così da includerlo nella lista indicizzata.

1994
Viene lanciato Lycos, un motore di ricerca che dimostra in poco tempo la sua grande potenza nell’ispezionare il web e il proprio innovativo sistema di ricerca basato sull’importanza attribuita alle ricerche già effettuate in precedenza, nonché sulla possibilità di approssimare le parole usate per l’indagine. Il suo archivio, composto da 394.000 documenti a solo un mese dalla sua nascita, si espanderà sino a contenerne più di 60 milioni nel novembre del 1996. (Lycos si evolverà poi in portale web d’intrattenimento, con fornitura di servizi e-mail e social network.)

1994
Negli stessi anni nasce Yahoo!, grazie all’impegno di David Filo e Jerry Yang. Ideato inizialmente come una raccolta delle pagine web preferite dai due informatici statunitensi, Yahoo! si impone sulla concorrenza grazie ad un’importante novità: ogni sito web che viene indicizzato è dotato di una descrizione. Yahoo! negli anni non solo cresce notevolmente, ma inizia ad inserire al proprio interno siti commerciali, facendo pagare un canone annuo per far parte del suo archivio.

1995
Compare AltaVista, dotato di una larghezza di banda quasi illimitata per i tempi e primo a offrire le query in un linguaggio naturale. Diviene uno dei motori di ricerca più popolari tra gli utenti per la sua velocità, poi surclassato da Google e acquistato, nel 2003, da Yahoo!

1996-1998
In questi anni, per la prima volta, i webmaster iniziano a “ottimizzare” i siti, ovvero a svolgere tutte quelle attività finalizzate a ottenere la migliore rilevazione, analisi e lettura del sito web da parte dei motori di ricerca.
Si pubblicano sul web i primi documenti che parlano di analisi e di estrazione dei dati dalle pagine web. Per la prima volta, John Audette e Bruce Clay utilizzano il termine SEO (Search Engine Optimization), presentato ufficialmente nel 1997, riferendosi all’opera di tecnici qualificati che “ottimizzano” le pagine online (struttura, testi, immagini etc) così da essere più facilmente trovati dai motori di ricerca.

1998
Il genio di Sergey Brin e Larry Page, due studenti di Stanford appassionati di matematica, porta alla creazione del PageRank, un algoritmo di analisi atto alla catalogazione dei siti attribuendovi importanza o meno sulla base del peso assegnato a ogni elemento di un collegamento ipertestuale. Con il PageRank nasce Google, destinato a diventare il sito e motore di ricerca più visitato.

2001
Si verifica una massiccia migrazione degli utenti verso Google che, di fatto, diviene il motore di ricerca più usato dagli internauti. Nello stesso anno, l’introduzione dei primi Social Network segnano una nuova rivoluzione e pongono la necessità di integrare, negli algoritmi di ricerca, i segnali e le tendenze provenienti da essi.

2009
Microsoft concretizza il bagaglio di conoscenze acquisite da precedenti esperienze (MSN Search, Live Search, Windows Live Search) in un nuovo motore di ricerca: Bing. L’anno successivo anche Yahoo! abbraccia la tecnologia di Bing, cominciando ad utilizzare il motore di ricerca di Microsoft nel suo portale.

2010
Google lancia Google Instant, ovvero la casella di ricerca in tempo reale, che mostra i risultati considerati più pertinenti dal sistema nel momento stesso in l’utente digita la ricerca.

2011-2014
In questi ultimi anni gli aggiornamenti dell’algoritmo di ricerca di Google si fanno sempre più intensi, e sono volti da un lato a migliorarne le performance semantiche, dall’altro penalizzare comportamenti scorretti nella rete. Ecco i principali aggiornamenti, dai nomi più strani:

– 2011 – Google Panda: filtro di ricerca che penalizza i siti con contenuti di bassa qualità.
– 2012 – Google Penguin: intercetta i siti che, utilizzando tecniche di spam, hanno generato link in entrata non in maniera naturale, ma a pagamento.
– 2013 – Google Hummingbird: algoritmo studiato per comprendere il significato semantico di una ricerca piuttosto che basarsi sulle singole parole.
– 2014 – PigeonUpdate: i risultati di ricerca vengono geolocalizzati in base alla zona in cui la ricerca stessa viene eseguita.

2015
In corso! Stay tuned!

approfondimenti

Per saperne di più

 

– Softrade.it
– Gigasweb.it
– Informatica-logica.com