Crowd leert computer lezen

Leer de computer lezen en help mee aan het woord voor woord doorzoekbaar maken van de Amsterdamse Notariƫle Archieven.

Stand van zaken

  • 42.056 scans
  • 494 deelnemers

  • 33.338
    • 3.4% Onbruikbaar
    • 79.3% Ingevoerd
    • 78.8% Gecontroleerd
    Ingevoerd 82.7%
  • 33.155
    • 3.4% Onbruikbaar
    • 79.3% Ingevoerd
    • 78.8% Gecontroleerd
    Gecontroleerd 82.3%

Project info

 
Lisa Orde

Lisa Orde

Wel of niet op volgorde zetten?

L.S.

Ik weet niet wat te doen of hoe het volgende te verwerken. Kan het ook niet terugvinden in vragen/opmerkingen:

Ik heb een tekst (JACOB DE WINTER / A16098000359) waarbij regel 1 op de scan (linkerbladzijde) regel 1 is in de transcriptie, regel 2 (scan) opeens regel 4 is in transcriptie en regel 3 van de scan is regel 6. Regels 2, 3 en 5 van de transcriptie zijn dan regels van de rechterbladzijde en zodoende loopt de transcriptie volledig door elkaar heen. Ook bladzijdenummer en marges komen soms in de transcriptie op, voor mij, onlogische plekken.

Mijn vraag is: hoe moet ik dit verwerken? Wellicht maakt het allemaal niet uit, maar ik weet nu dus niet hoe te starten met deze scan.

Groeten

  • Pauline (Stadsarchief Amsterdam)

    Pauline (Stadsarchief Amsterdam)

    Laatst bijgewerkt op: 

    Dag Lisa, sorry voor de late reactie!

    De belangrijkste instructie is eigenlijk: voer de regel in die op de lijn op de scan ook getoond wordt. Dat blijft hier hetzelfde, al lijkt het inderdaad onzinnige tekst op te leveren. 

    Ik heb de scan bekeken en het komt hier waarschijnlijk doordat de hele scan als één tekstblok is gezien door de computer (het groene vlak op de scan), waar hij er eigenlijk minstens twee had moeten zien, nl de linker- en de rechterpagina. De computer 'leest' binnen zo'n vlak van links naar rechts, dus vandaar de verspringingen. Als er op de rechterpagina woorden 'hoger' staan dan op de rechter worden ook die eerder gelezen, dus dan lijkt de chaos compleet. 

    Overigens zijn de regels gekoppeld aan coordinaten op de scan. Daardoor is het in principe mogelijk om de tekst exact zo te reconstrueren in de leesvolgorde/positie op de scan. Dus er is geen man overboord, al snap ik dat het onhandig invoeren is zo. 

  • Pauline (Stadsarchief Amsterdam)

    Pauline (Stadsarchief Amsterdam)

    Controleurs komen deze scans overigens vanzelf weer tegen, en als het om een behapbaar aantal gevallen gaat herstellen we het dan ook wel eens handmatig. Dan kunnen die regels, met invoer en al, binnen een ander tekstblok geplaatst worden. 

  • Jirsi Reinders

    Jirsi Reinders

     Ik heb de segmentatie meteen maar even aangepast om het de controleurs ook wat gemakkelijker te maken! Dank voor de melding, Lisa! In het algemeen mogen dit soort opmerkingen over grote segmentatieproblemen trouwens ook gemeld worden via de 'opmerkelijk'-knop.

  • Lisa Orde

    Lisa Orde

    Okee, super. Bedankt voor de informatie en ik ga weer aan de slag. Mocht ik het nog eens tegenkomen dan zal ik het via de 'opmerkelijk'-knop melden.