Zo maar een voorbeeld: Middeloo te Velsen. Grotere weergave volgt na muisklik op afbeelding.
Bron: Opregte Haarlemsche Courant, 24-05-1808. Via KB Historische Kranten.
Ik mag graag zoeken, bladeren en lezen in oude kranten. Veel kranten zijn al (deels) gedigitaliseerd. Een overzicht biedt kranten-historisch.startpagina.nl.
Ook de Koninklijke Bibliotheek had al een webpage om in gedigitaliseerde krantenpagina’s te zoeken. En afgelopen donderdag ging het langverwachte nieuwe KB Historische Kranten in de lucht.
Een omvangrijk deel van alle landelijke, regionale, lokale en koloniale kranten die zijn verschenen tussen 1618 en 1995 wordt gedigitaliseerd. Het betreft meer dan 70 verschillende kranten, van de Oprechte Haarlemsche Courant tot het Algemeen Handelsblad en de Rotterdamsche Courant. Nu zijn één miljoen paginaxe2x80x99s voor iedereen toegankelijk. De overige zeven miljoen paginaxe2x80x99s worden in de komende achttien maanden in etappes aan de website toegevoegd (zie ook bericht KB presenteert 400 jaar kranten online).
Van alles is te vinden. Is het niet via KB dan wel via al die andere opties als in genoemde startpagina. Veel is ook nog niet gedigitaliseerd, dus veel zul je ook niet, of nog niet, vinden. En heel veel heeft ook gewoon niet in de krant te staan. En dan zijn er nog redenen van laten we zeggen op het gebied van zoekwoorden en van ‘zoektechnische aard’.
Om uit de losse pols een aantal te noemen:
– variaties in naamgeving, denk aan Beeckestijn. Op hoeveel wijzen kan en is dat niet geschreven?
– of een aanduiding als Chinees of Turks (bij bv tent of tuin). Vaak ook Chineesche, Chinesche, Turksche. Allerlei variaties waar per stuk mee gezocht moet worden.
– en daar op voortbordurend, het gebruik van de lange-s (?). Dus de s die leest als een f zonder het dwarsstreepje. Kijk en dat is wat met het digitaliseringsproces gebeurt. Die lange-s wordt herkent als een f. En daarmee wordt het Engelfche i.p.v. wat het menselijk oog herkent als Engelsche. Zie bovenstaande advertentie met Engelfche Plantfoenen (2x ‘f’).
– en op het technische aspect doorgaand. De krantenpagina die u ziet is een ‘plaatje’, een ‘foto’ van de pagina. Deze is geïnterpreteerd naar ‘normale’ tekst, en op die tekst wordt gezocht. Maar deze omzetting gaat gepaard met fouten. Vlekjes en vouwtjes, om maar twee voorbeelden te noemen, daar kan het menselijk oog wel mee over weg. Maar software? Nee, die is daar minder goed in. Bv Zocher kan dan ineens Zoeher worden. De bovenstaande advertentie resulteerde na omzetting in de volgende tekst:
Uitdehandtekoop: Een extra welgeütiieerde en zeer geëxtendeerde HOFSTEEDE en OVERPLAATS, genaamd MIDDELOO, met deszelfs capitale, zeer aanzienlijke en pretleus betimmerde Heeren-Huizinge , Tuinmans-Wooning, Koetshuis en Paarden-Stallinge , Orangerie, Billard-Kamer, Chinecfehe Sallon , Hermitage, Viukenhuis en verdere Getimmertens, voorts bevallige. Engelfche Plantfoenen, vischrijke Vijvers en Carper-Kom, Bosfchen , Laanen, Boomgaarden, Menagerie, Moes-en Broekuihen, Annanasfen-Bak, Perfiken-‘en Dnrivcu-K.isfen , en laatftelijk de extra weltoegeniaakte Bouw-, Hooi-en Weilanden, Duingronden &c., alles ftaande en gelegenaan de Jtfiddcn-Weg, nabij en onderden Geïcchie van Yelfsa; tebe.vnweubijdeMake-
Dus Chineesche Sallon als zoekterm komt niet met deze advertentie terug, want de omzetting resulteerde in Chinecfehe Sallon. Idem voor Engelsche Plantsoenen; hier resulteerde het in Engelfche Plantfoenen.
Of te wel, gegevens worden vaak niet zo maar gevonden. Als je hetgeen je zoekt niet kan vinden betekent het niet dat er niet over is geschreven. De enige zekerheid die je hebt is simpelweg dat jij niets hebt kunnen vinden.
En ten aanzien van ‘Wegens te grote drukte op deze site’: met veel enthousiasme en belangstelling is de website onthaalt, met als resultaat een overbelasting en de boodschap: Wegens te grote drukte op deze site is het momenteel niet mogelijk alle vragen te verwerken. Onze excuses hiervoor. Wij verzoeken u het later nogmaals te proberen.
Gewoon volhouden! JH