Ik weet niet wat te doen of hoe het volgende te verwerken. Kan het ook niet terugvinden in vragen/opmerkingen:
Ik heb een tekst (JACOB DE WINTER / A16098000359) waarbij regel 1 op de scan (linkerbladzijde) regel 1 is in de transcriptie, regel 2 (scan) opeens regel 4 is in transcriptie en regel 3 van de scan is regel 6. Regels 2, 3 en 5 van de transcriptie zijn dan regels van de rechterbladzijde en zodoende loopt de transcriptie volledig door elkaar heen. Ook bladzijdenummer en marges komen soms in de transcriptie op, voor mij, onlogische plekken.
Mijn vraag is: hoe moet ik dit verwerken? Wellicht maakt het allemaal niet uit, maar ik weet nu dus niet hoe te starten met deze scan.
De belangrijkste instructie is eigenlijk: voer de regel in die op de lijn op de scan ook getoond wordt. Dat blijft hier hetzelfde, al lijkt het inderdaad onzinnige tekst op te leveren.
Ik heb de scan bekeken en het komt hier waarschijnlijk doordat de hele scan als één tekstblok is gezien door de computer (het groene vlak op de scan), waar hij er eigenlijk minstens twee had moeten zien, nl de linker- en de rechterpagina. De computer 'leest' binnen zo'n vlak van links naar rechts, dus vandaar de verspringingen. Als er op de rechterpagina woorden 'hoger' staan dan op de rechter worden ook die eerder gelezen, dus dan lijkt de chaos compleet.
Overigens zijn de regels gekoppeld aan coordinaten op de scan. Daardoor is het in principe mogelijk om de tekst exact zo te reconstrueren in de leesvolgorde/positie op de scan. Dus er is geen man overboord, al snap ik dat het onhandig invoeren is zo.
Controleurs komen deze scans overigens vanzelf weer tegen, en als het om een behapbaar aantal gevallen gaat herstellen we het dan ook wel eens handmatig. Dan kunnen die regels, met invoer en al, binnen een ander tekstblok geplaatst worden.
Ik heb de segmentatie meteen maar even aangepast om het de controleurs ook wat gemakkelijker te maken! Dank voor de melding, Lisa! In het algemeen mogen dit soort opmerkingen over grote segmentatieproblemen trouwens ook gemeld worden via de 'opmerkelijk'-knop.