maandag 30 november 2009

VVOJ Conferentie - dag 2

Na vier uurtjes slaap zat ik zaterdagochtend om half negen alweer op de fiets naar de Uithof (in de regen!) voor de Internet Bootcamp van Eric Hennekam: Zoeken in archieven. Een hele nuttige sessie! Deze docent bleek een heuse goeroe.

Zoals Michaël Opgenhaffen de vorige dag al aanstipte: Veel informatie krijg je niet boven met Google, omdat de gegevens in internetdatabanken niet worden geïndexeerd door zoekrobots. Eric Hennekam liet ons zien hoe je het invisible web kunt verkennen en deelde vele internetarchieven met ons.

Dit doet hij overigens ook op zijn website archieven.org en via Twitter deelt hij elke dag de nieuwe bronnen die hij hieraan toevoegt. Echt een aanrader om te volgen, evenals zijn blog.

Dan de zoekstrategie die centraal stond in zijn verhaal: de archiefvormers. Bepaal bij elke vraag altijd welke personen, bedrijven, instellingen, verenigingen, etc. mogelijk betrokken zijn bij je onderwerp. Aan de hand hiervan kun je op zoek gaan naar archieven van die archiefvormers.

Voor het zoeken naar beeld en geluid noemde hij een aantal sites waar ik nog nooit van gehoord had...! Zoek maar eens in Archiefzoeker op de zoekterm 'beeldbank'. Meest interessant leek mij de grootste videozoekmachine ter wereld: Blinkx. De overige weblinks zal ik later deze week delen, ik heb inmiddels de handout van de bootcamp toegemaild gekregen.

Tenslotte schrijft Hennekam in zijn weblog 'Schokkend' over zijn VVOJ-ervaringen, ikzelf vond het meest 'schokkend' te vernemen dat alle sms-berichten van 9/11 te vinden zijn op WikiLeaks...!

Meer met minder beeld
Ook schokkend waren de wedervaardigheden van 2 NRK-journalisten bij het maken van de documentaire 'Dirty Cargo' waarin ze een Noors Trafigura-schandaal blootlegden. Lees hier de aankondiging op de NRK-site; documentaire met Engelse ondertitels staat (nog) niet op internet.

zondag 29 november 2009

VVOJ Conferentie - dag 1

Inmiddels het slaaptekort weer ingehaald en dus hoogste tijd om verslag te doen van de VVOJ Conferentie 2009:

Interessante verhalen gehoord de afgelopen 2 dagen, o.a. over de Trafigura-affaire, de overname van ABN Amro en de Irak-kwestie. Maar meest interessant voor ons docu's waren de Internet Bootcamps die ik gevolgd heb bij Michaël Opgenhaffen en Eric Hennekam.

Internet Bootcamp: De perfecte zoekvraag
Onder het motto "Meer vinden in minder tijd" deelde Michaël Opgenhaffen vrijdag een aantal zoektips met en zonder Google:
  • Allereerst hoe je minder zoekresultaat kunt krijgen met meer relevantie door gebruik te maken van de Google webgids. Door hierin te zoeken naar een onderwerp +directory kun je Google ook 'misbruiken' om andere webgidsen te vinden.
    Voor mij een eye opener: waar ik in het pre-Google-tijdperk vaak gebruik maakte van de zoekrubrieken in Yahoo! is deze zoekmethode bij mij helemaal in vergetelheid geraakt. Voornemen om de komende tijd dit weer eens vaker te gaan gebruiken.

  • Vervolgens een aantal geavanceerde Google zoektips die niet allemaal nieuw waren. Maar de uitleg achter het zoekresultaat dat Google geeft was wel nieuw voor mij; dat niet alleen alle woorden geïndexeerd worden door Google zoekrobots, maar dat deze vooral het aantal links naar een webpagina meetellen bij het rangschikken van het zoekresultaat (en dat hier dus misbruik van gemaakt kan worden door fake-pagina's te maken met oneindig veel links naar een pagina die je hoog in het Google zoekresultaat wilt krijgen).

    En ook geleerd dat de spiders tegengehouden kunnen worden met een script dat je terug kunt vinden door "/robots.txt" achter een url in te tikken. Bij de NOS is deze lijst niet zo lang, maar bij het AD wel...

  • Zoeken met inurl/intitle/allintitle/filetype is voor mij niet nieuw, zoeken met synoniemen door gebruik te maken van "~" wel. Exact phrase zoeken d.m.v. aanhalingstekens is ook niet nieuw, maar wel dat je hierin kunt trunceren door "*" te typen als joker voor een woord dat je niet weet.

    Via allintitle gezocht naar het curriculum van Yves Leterme, waarbij we opmerkelijk genoeg stuitten op het CV van Steven Vanackere...!

  • Verder ook besproken hoe je de betrouwbaarheid van een website kunt checken. Zo kun je bijvoorbeeld via www.whois.com ontdekken dat de website martinlutherking.org geregistreerd is door Don Black van het Stormfront...! Aanwezige cursisten noemen www.dns.be en www.sidn.nl als andere goede sites waarop je kunt ontdekken wie er achter een website zit. Op www.lii.org vind je een verzameling "websites you can trust".

  • Op Thumbshots kan je de zoekresultaten vergelijken tussen twee zoekmachines. Om in meerdere zoekmachines tegelijk te zoeken, kun je zoeken in metazoekmachines als Metacrawler of Dogpile.

  • Google alerts en de cache functie waren mij al bekend, evenals zoeken in blogs. Technorati wordt genoemd als goede zoekmachine voor weblogs, search.twitter.com als zoekmachine voor Twitter. In de advanced search options zie ik dat je hierin ook op datumrange kunt zoeken, maar de Tourtweets zijn hierin niet terug te vinden. Ik krijg de melding "No results for pistolero since 04-07-2009 until 26-07-2009".
Op de VVOJ Conferentie werd heel wat afgetwitterd, zo ook door onze Clytaemnestra die 2 uur geleden nog meldde dat-ie nog aan het bijkomen is van de #VVOJ09. De VVOJ site meldt dat deze hashtag in de NL Twitter Top 5 is terechtgekomen.

Onderzoeksjournalisten Philip de Witt Wijnen, Peter Thal Larsen en Jeroen Smit over hun verslaggeving rond het overnameproces van ABN Amro. Laatstgenoemde zou tijdens het diner De Loep uitgereikt krijgen voor zijn boek 'De Prooi'.
Foto: Robert Oosterbroek/VVOJ