Het internet verandert elke dag. Sites verschijnen en verdwijnen bijna als kranten. Maar alle kranten bewaren we in archieven. Als onderzoekers in de toekomst onze tijd bestuderen, mag internet niet ontbreken: wie bewaart het internet? Brewster Kahle uit Californië startte er een stichting voor. Die archiveert alle sites in de Wayback Machine, onderdeel van zijn grote project: het Internet Archive. De “bibliotheek van Alexandrië versie 2″ daaraan werkt hij sinds 1980. Versie 2 is digitaal en tegen brand bestand. Dus staan de servers van deze kennisbron in San Francisco, Alexandrië en … in Amsterdam. Bij ons.

Wij gaan voor access for all, het Internet Archive gaat voor: “Universal access to all human knowledge”. Universele toegang tot alle kennis van de mensheid. De lat ligt hoog. Wij hosten de EU-sectie van het Internet Archive sinds 2004. Een rack van 2,5 petabyte staat in ons datacenter. Binnenkort wordt het 4 petabyte. De hele Internet Archive collectie neemt op dit moment 35 petabyte aan data. Best flink. Wij interviewden Brewster Kahle.

Mooi initiatief. Bewijst het nu al zijn nut?
“We verzamelen wekelijks 1 miljard pagina’s. Met crawlers én bibliothecarissen. Er werken inmiddels 150 mensen bij het Internet Archive. Elke dag gebruiken een half miljoen mensen de Wayback Machine. Zeker nu in tijden van nepnieuws. Het is 1 van de bronnen geworden voor journalisten om te checken of een organisatie zijn statements gewijzigd heeft. Of wat een politicus net weggehaald heeft. Het is een back-up voor mensen. En er gebeuren meer interessante dingen op dat vlak. YouTube heeft bijvoorbeeld links naar Wikipedia-pagina’s toegevoegd bij filmpjes. Mensen krijgen meer context aangeboden voor hun beoordeling: is dit echt? Wikipedia en het Internet Archive laten de kracht zien van de ‘dot org’-sector. De Wayback Machine kan iedereen gebruiken. Je kunt je eigen oude websites erin terugvinden, het echt voor geschiedenis gebruiken. Maar het kan ineens ook heel belangrijk worden door ontwikkelingen nu.”

Is het niet een overheidstaak: archiveren?
“Ja, idealiter zeker, maar dan moet die overheid het wel doen. Toen ik startte in de tachtiger jaren heb ik eerst geprobeerd of de Verenigde Naties het archief wilde bijhouden. Maar het bleef te vrijblijvend. Ik zag het er niet van komen, dus ben ik zelf een stichting begonnen: non profit. Zo kan het ook. Sinds 1996 is de website archive.org live. Het is voor mij essentieel dat het Internet Archive een non-profitorganisatie is en blijft. Het is een gratis service en heeft een publieke functie.”

Hoe kwam u vanuit Californië bij XS4ALL uit?
“Wil het archief verder groeien, dan moet uiteindelijk op een aantal plaatsen ter wereld het complete archief staan. Als de bibliotheek van Alexandrië een kopie in Azië had gehad, kenden we nu alle werken van Aristoteles. Maar branden en roerige Alexandrijnse tijden hebben die kennis vernietigd. Met het Internet Archive moeten we die fout niet maken. Wij willen ook bij verandering van regimes – in China zijn wij van het web gevaagd – door de tijd blijven bestaan. Ik had onderzoek gedaan naar een Europese standplaats voor het archief. Holland heeft altijd een grote rol gespeeld in het internet als groot switching point en is belangrijk als neutrale bodem. Rop Gonggrijp (1 van de XS4All-oprichters, red.) moest ik hebben volgens kenners in de VS. Jullie waren in 2004 al gekocht door KPN. Ik moet zeggen dat ik dacht dat jullie publieke rol toen uitgespeeld zou zijn. Maar ik werd verrast. Rop was al weg bij XS4ALL, maar hij was enthousiast en hielp mij enorm. Ik kwam toch binnen bij XS4ALL en de cultuur was nog intact – en nu nog steeds. Dat is niet hoe het gewoonlijk gaat, dus ik was op mijn hoede. Ik heb met veel mensen gesproken en het zelf gecheckt – ze hadden de wil om mensen te helpen en niet alleen voor geld te gaan. Dat vond ik fantastisch. XS4ALL was genereus. Ik kreeg echte ondersteuning: geld voor servers, serverruimte, elektriciteit, m2, onderhouden en wel. Sinds 2004, tot op de dag van vandaag. Amsterdam mag dan klein zijn, je bent er welkom als buitenstaander. Zo heb ik dat ervaren. Dus startten we het European Archive, waar we Europese sites crawlen, die we op Europese bodem opslaan in Amsterdam bij XS4ALL.”

Heeft het alleen voordelen om alles voor altijd vast te leggen?
“Het Internet Archive is een hele hoop kennis. 500 miljard webobjecten, 3 miljoen boeken, 3 miljoen muziekbestanden. Het is enorm. En alle culturele informatie geeft macht. Er zullen altijd mensen zijn die bepaalde kennis niet willen verspreiden. En er staan dingen op internet die controversieel zijn. Dus moet je je rol als bibliotheek goed kennen. Wij bewaren alle websites. Daar zijn wij open in en we nemen deel aan de publieke discussie. Zo proberen wij het goed te doen en we passen ons aan als blijkt dat het beter kan. Een van de mooiste uitspraken daarover komt van een van jullie eigen CEO’s. Hij zei over de risico’s: ‘Brewster, als het geen probleem is, is het geen probleem. Briljant! Komt er een probleem, dan handelen we ernaar, maar we gaan het wel proberen. Heerlijk dat Nederlandse: leef en laten leven! En privacy? Alles in het archief is op het web gepubliceerd. Maar mensen schrijven ons elke dag wel of we hun oude site willen verwijderen. En ja, we halen ook wel webpagina’s weg. Wij hebben een buigen-niet-barsten-mentaliteit. Zo blijf je bestaan.”

Deel dit:

Reacties

  1. Mike H. says:

    Kijk eens aan, dat XS4ALL de opslag (van het EU-deel ) van gegevens die het Internet Archive verzamelt mede faciliteert – en dat dus blijkbaar al sinds 2004 – wist ik nog niet. Zeer interessant feit, mag ik wel zeggen. Hulde aan XS4ALL dat men destijds dit genereuze aanbod aan het Internet Archive heeft gedaan en kennelijk nog steeds gestand doet. Dit draagt nog eens extra bij aan mijn blijdschap over het feit dat XS4ALL mijn ISP is.

    Ik had het overigens wel aardig gevonden als er door de redactie over dit onderwerp ook een klein gesprekje met Rop Gonggrijp zou zijn gevoerd. Zijn kijk op de betrokkenheid van XS4ALL bij het Internet Archive had ik graag willen vernemen als verdere verrijking van dit blog-artikel. Ook een fotootje van Brewster Kahle bij zijn bezoek aan XS4ALL was wel aardig geweest. Voor geïnteresseerden hier dan maar een link naar zijn profiel met foto op de website van het Internet Archive, waar hij als eerste persoon vermeld staat: https://archive.org/about/bios.php

    Het leek mij overigens wel toepasselijk om deze webpagina (dus dit blog-artikel) handmatig op te slaan in de Wayback Machine op het Internet Archive en daarom heb ik dat zojuist maar even gedaan. Bleek ik vervolgens op de verkeerde URL te klikken toen ik vanuit de browsergeschiedenis nog een keer terug wilde gaan naar de opgeslagen pagina, waardoor hij doodleuk nogmaals werd opgeslagen… Nou ja, extra backup zullen we maar zeggen :-)

    Uitstekend artikel verder, keep it up!

  2. HGM says:

    Wow, dit is een geweldig initiatief. En het feit dat China er bang voor is (later missschien ook Rusland) bewijst al dat de opslag waarde heeft. Vergelijken wat een politicus in het verleden heeft gezegd en wat dezelfde politicus nu zegt kan heel waardevol zijn. Ik weet niet hoeveel wetenschappelijke publicaties er op internet zijn want die verschijnen meestal in boeken of tijdschriften, maar de discussies erover worden meestal op internet gevoerd. En die worden dus ook bewaard. Of er ook internet nieuws wordt bewaard van reguliere tv kanalen weet ik niet, maar voor onderzoekers moeten het kunnen terugblikken in het verleden een bron van kennis zijn. En ze hoeven er dan geen boeken of tijdschriften in stoffige archieven voor door te bladeren maar kunnen het rechtstreeks thuis op het scherm bekijken. Ik ben benieuwd hoe dit initiatief zich verder ontwikkelt.

  3. H. de Jong says:

    Waarom zouden we echt alle webpagina’s die er ooit zijn geweest willen bewaren? Heeft dat zin? En waarom op een (virtueel) centrale plaats? Nooit in de geschiedenis werd alles bewaard, informatie verdampte, diffundeerde. Daarmee was er ook een evolutie-mechanisme actief: niet alle informatie “redde” het, de “sterkste” informatie overleefde. In termen van internet: de “sterkste” informatie overleeft doordat die verspreid wordt bewaard bij alle belangstellenden / belanghebbenden. Evolutie-mechanismes werken bij gratie van geboren worden, leven en sterven. Als niemand meer zou sterven, zou er ook niemand meer geboren kunnen worden. Ideeën komen op, doen de ronde, en sterven na enige tijd weer af. Sommige ideeën houden het heel lang vol, zoals die van Newton, Einstein, etc. Andere ideeën zijn allang weer verdwenen, maar als er behoefte aan is worden ze gelukkig vanzelf weer geboren.
    In elk geval ben ik benieuwd naar de selectieparameters die bepalen of een webpagina in The Vault komt. Maar uiteindelijk heeft het merendeel van zelfs die geselecteerde pagina’s na enige tijd de waarde van de webpagina van Het Kaasboertje met “Alleen Deze Week Jong Belegen Maaslander voor de Feestdagen!”.

    • Tva says:

      Dus jouw visie is om niets te doen omdat waarschijnlijk 95% van het archief geen politieke, journalistieke of revolutionaire waarde heeft? Het gaat om die overige 5% waar niemand meer de waarheid kan verdraaien.

  4. anoniem says:

    Ja, een zeer nuttige dienst dat internet archief! (Er staat een typfoutje in: Hoe kwam u vanuit Californië bij XS4AL uit?)

Leave a Reply

Your email address will not be published. Required fields are marked *