Crowd leert computer lezen

Leer de computer lezen en help mee aan het woord voor woord doorzoekbaar maken van de Amsterdamse Notariƫle Archieven.

Stand van zaken

  • 42.056 scans
  • 495 deelnemers

  • 33.338
    • 3.4% Onbruikbaar
    • 79.3% Ingevoerd
    • 78.8% Gecontroleerd
    Ingevoerd 82.7%
  • 33.155
    • 3.4% Onbruikbaar
    • 79.3% Ingevoerd
    • 78.8% Gecontroleerd
    Gecontroleerd 82.3%

Project info

 
Pauline (Stadsarchief Amsterdam)

Pauline (Stadsarchief Amsterdam)

Mijlpaal: de eerste resultaten staan online

Nog niet eens zo heel lang geleden besloten we het indexeren van de notariële archieven een handje te helpen door Handwritten Text Recognition (HTR) technieken in te gaan zetten. Dat was geen gloednieuwe uitvinding, maar HTR was met de nieuwe mogelijkheden van machine learning wel in een stroomversnelling gekomen. Wat als je rechtstreeks in grote hoeveelheden oude handschriften zou kunnen googelen? 

Jullie waren hierin ware pioniers, door met de combinatie van VeleHanden en Transkribus Ground Truth, correcte transcripties, te verzorgen. Sommigen van jullie waren zelfs betrokken bij het eerste, interne Crowd Leert Computer Lezen project, waarin de computer echt de eerste stapjes van het ABC zijn geleerd. De duizenden bladzijden zijn gebruikt voor het trainen en hertrainen van de computermodellen, en ze worden gedeeld en hergebruikt om steeds weer stappen verder te komen. En we zijn nog niet klaar, het wordt alleen maar beter!

Dankzij jullie is het allemaal mogelijk. Namens alle gebruikers, speurneuzen, liefhebbers, ontwikkelaars in kunstmatige intelligentie: Bedankt! 

Zie ook het nieuwsbericht op de website van het Stadsarchief Amsterdam.