venerdì 22 agosto 2014

https://archive.org/ - l'arca della memoria

Corriere della Sera » Il Club de La Lettura » Articolo » L’arca della memoria

La Rete della conoscenza

L’arca della memoria

«Ho creato l’archivio del sapere dell’umanità. Chiedo aiuto a tutti per la digitalizzazione»

04-brewster-kahle_190x130
La «nuova biblioteca di Alessandria» è all’interno di un blocco di marmo bianco in stile neoclassico all’incrocio tra Clement Street e Funston Avenue, nord-ovest di San Francisco.

Vista da fuori sembra la sede di una setta. Del resto, sulla facciata principale un tempo c’era scritto «Fourth Church of Christ, Scientist». «Ma dal 2009 non è più la chiesa dei cristiani scientisti», rassicura Brewster Kahle. Cinquantatré anni, una moglie esperta in tipografia classica e tecniche di rilegatura, due figli maschi di 20 e 17 anni, Kahle è il padre di Internet Archive, la più grande biblioteca digitale non profit creata con un solo scopo: «Permettere l’accesso universale alla conoscenza». All’interno dell’ex chiesa molto è rimasto intatto. Resiste ancora la sala di preghiera con i suoi banchi di legno e il pulpito. Ma pochi passi più in là c’è una sfilza di scatoloni, scheletri di hard disk esterni e altri scatoloni e ancora scatoloni. E poi blocchi di server, alcuni enormi, altri incastonati anche nelle stanze più piccole. E poi decine di miniature in fila tra i banchi: sono quelle di chi ha dato — e continua a dare — una mano all’organizzazione. La miniatura di Kahle è vicina a quella di Aaron Swartz, il programmatore e attivista americano che si è tolto la vita nel 2013, a 26 anni, mentre aspettava il processo con l’accusa di aver scaricato illegalmente 4,8 milioni di articoli scientifici. «Aaron ha lavorato per due anni al mio fianco — racconta il fondatore a “la Lettura” —, lo conoscevo molto bene».
Da questa struttura vengono gestiti i data center che fino a ora hanno memorizzato 417 miliardi di siti web; 6,3 milioni di testi; 1,67 milioni di video (film, telefilm, telegiornali); 2,05 milioni di file audio (di cui oltre 130 mila concerti live). «Internet Archive è la casa di più di 15 miliardi di gigabyte di informazioni digitali», calcola Kahle.
Un passato nei laboratori del Massachusetts Institute of Technology a studiare l’intelligenza artificiale. Poi lo sbarco nel mondo dell’imprenditoria: nel 1989 come realizzatore di Wais, un motore di ricerca dei testi sui computer remoti, venduto per 15 milioni di dollari ad America Online (Aol) nel 1995; l’anno dopo come co-fondatore di Alexa, servizio che cataloga tutto quello che viene messo online, ceduto ad Amazon nel 1999 per 250 milioni di dollari. Con questi soldi viene avviato Internet Archive che oggi funziona con un budget che varia tra i 10 e i 12 milioni di dollari. Brewster parla muovendosi senza sosta su una poltroncina a dondolo di pelle nera in una stanza con pareti metà color verde acqua e metà bianche.
Come inizia tutto questo?
«Quando avevo 19 anni e studiavo Scienze informatiche al Mit. Un mio amico mi fece una domanda semplice, ma decisiva: “Secondo te, per cosa vale la pena lavorare in questa vita?”».
Lei cos’ha risposto?
«Ho dato due risposte, in realtà. La prima: per sviluppare un microchip in grado di assicurare la privacy delle telefonate. Ma non ci sono riuscito. La seconda: per creare la versione digitale della biblioteca di Alessandria. Questa, almeno per ora, la sto realizzando ».
Nel 1996 parte Internet Archive. Come andò?
«Qualcuno disse che eravamo dei pazzi, che era impossibile. Qualcuno che non ne valeva la pena».
Ne è valsa la pena?
«Per ora sì. Il lavoro non manca, le difficoltà nemmeno. Ma pensi che a noi si rivolge anche l’Ufficio americano dei brevetti: chiede l’accesso agli archivi per capire se un’idea che qualcuno vuole registrare sia originale o meno».
Perché i servizi sono gratuiti?
«Ha mai visto una biblioteca, che si possa chiamare tale, a pagamento? La conoscenza deve essere accessibile a chiunque, senza vincoli di alcun tipo».
È quello che voleva fare anche Aaron Swartz…
«Aaron era un faro, era la luce che illuminava il percorso per il web libero, gratuito, democratico e alla portata di tutti».
C’è qualcuno che in questa storia ha sbagliato?
«Beh, il Mit, ma anche Jstor, il database che raccoglie le pubblicazioni accademiche. Hanno gestito il caso Swartz in modo pessimo. Si sono comportati esattamente come due realtà del vecchio mondo, quello che prevede non la massima libertà, ma la massima restrizione».
Cinque anni dopo Internet Archive arriva Wayback Machine. La piattaforma che permette di consultare i siti web degli anni precedenti.
«È stato un successone sin dall’inizio. Forse siamo diventati famosi proprio per questo servizio».
Perché l’idea di un motore di ricerca «storico» delle pagine Internet?
«La durata media di una pagina web è di cento giorni. Poi quella pagina o cambia o viene cancellata. Non possiamo smarrire la nostra memoria digitale».
Uno può dire: ma a che servite voi? Tanto il vostro lavoro lo possono fare i giganti come Google, Microsoft e Yahoo!.
«È vero. Ma qualcuno sa dirmi se queste compagnie hanno lasciato tracce di alcuni dei loro siti? Google Video non c’è più. Yahoo Video nemmeno. Così come Geocities. Anche Apple ha fatto sparire Mobile Me. Per questo il nostro lavoro è vitale: catturiamo quello che compare e poi sparisce. E non abbiamo interessi di alcun tipo».
Come riuscite a collezionare tutto il materiale?
«Grazie al lavoro dello staff, dei volontari e di 300 organizzazioni in tutto il mondo».
E sui libri come si procede?
«Abbiamo trentatré centri di scannerizzazione dei testi sparsi in otto Paesi. Non c’è l’Italia, purtroppo, ma mi auguro possa entrare presto nella lista. Ogni giorno digitalizziamo più di mille libri».
Poi c’è la partecipazione delle persone comuni. A un certo punto, l’anno scorso, vi siete trovati una cosa mai vista…
«Un giorno ci chiama un certo Michael Metelits. Dice che sua mamma, Marion Stokes, è morta da poco e che gli ha lasciato in eredità 40 mila videocassette tutte ordinate per data e ora di registrazione. Non sapeva che farne e si è rivolto a noi. “Voglio regalarvi tutto il materiale”, ha detto».
Cosa c’è in quei nastri?
«Oltre trentacinque anni di notiziari americani. Ci sono anche i primi telegiornali con i sottotitoli».
Perché tutto questo grande lavoro, tra l’altro senza scopo di lucro?
«Lo dobbiamo ai nostri figli. Oltre a educarli, il nostro scopo è anche fare di tutto per lasciare loro qualcosa. Noi, nati e cresciuti nell’era delle biblioteche di carta, abbiamo avuto la possibilità di andare a fondo nelle cose. Ma oggi, dove tutto diventa sempre più digitale e disponibile con un click, viene meno proprio la profondità. C’è troppo materiale, ci sono troppi link da consultare».
E quindi è un bene…
«A mio parere no: tante cose da leggere ci portano a fermarci ai primi risultati dei motori di ricerca. Indicazioni valide, per carità. Ma che hanno il difetto di restare sulla superficie delle cose. Con Internet Archive vogliamo permettere ai nostri figli di poter arrivare a più livelli. Solo così cresceranno consapevoli».
Internet Archive potrà mai essere venduta?
«La nostra è una realtà non profit: l’organizzazione non è in vendita e per esistere non può essere parte di qualche compagnia digitale; se così fosse perderebbe la sua essenza. Certo, ci sono big che ci aiutano nel lavoro di digitalizzazione, ma questo in totale trasparenza e indipendenza».
C’è una competizione tra mondo digitale profit e non profit?
«Io penso che assisteremo a un balzo dell’hi- tech libero dal vincolo del guadagno. Ci siamo noi, c’è Wikipedia, ma anche Electronic Frontier Foundation e Mozilla. Una delle sfide del futuro sarà esattamente tra il mondo digitale non profit e quello profit».
Un altro tema importante è la neutralità della Rete. Negli Usa è forse diventato il banco di prova di quello che sarà il web.
«Questa è forse la battaglia più grande. Se le compagnie telefoniche vincono — e stanno facendo di tutto per farlo —, se riescono a far finire la neutralità, allora non ci sarà spazio per il web libero. Noi ci battiamo perché il traffico su Internet venga trattato senza corsie preferenziali da parte dei provider».
Qual è la prossima mossa di Internet Archive?
«Possiamo pure chiamarlo un processo di “wikipedizzazione”. Il materiale digitale da archiviare sta diventando sempre più ingente. Abbiamo bisogno che insieme a noi lo facciano anche le persone comuni: per questo stiamo lavorando alla realizzazione di una piattaforma dove ognuno, da casa, avrà modo di archiviare tutto quello che passa nel mondo».
Twitter@leonard_berberi

Leonard Berberi

da La lettura - corriere della sera 20 luglio 2014