Tag de tekst’ op VeleHanden en help AI om persoonsnamen, locaties en datums te vinden
In het project ‘Tag de tekst’ gaan we duizenden Nederlandstalige teksten uit de 17e eeuw tot en met de 19e eeuw taggen (annoteren). Dat betekent dat in de teksten wordt gezocht naar persoonsnamen, locaties en tijdsaanduidingen en dit geregistreerd (getagd) wordt.
22 September 2020
Het gaat om notariële teksten uit Amsterdam, Haarlem en uit andere provincies en archieven van de VOC. Deze zijn afkomstig uit het Stadsarchief Amsterdam, Noord-Hollands Archief, Nationaal Archief en Regionaal Historische Centra. Deze teksten zijn al getranscribeerd en worden in dit project getagd op persoonsnamen, locaties en tijdsaanduidingen. Dit vormt trainingsmateriaal voor Artificial Intelligence (AI). Dankzij deze voeding zal de AI steeds beter worden in het herkennen van persoonsnamen, locaties en tijdsaanduidingen (datums) in ruim twee miljoen teksten. In vervolgprojecten kan de AI verder getraind worden om ook andere begrippen te vinden in teksten, zoals scheepsnamen, beroepen of kunstvoorwerpen.
Dit project stelt ons in staat om handgeschreven teksten veel gedetailleerder doorzoekbaar te maken, bijvoorbeeld op locaties. Niet alleen van de archieven die meedoen aan dit project, maar op den duur ook elk Nederlands archief. Dat is goed nieuws, omdat er nog honderden kilometers documenten in Nederlandse archieven wachten op deze vorm van digitalisering.
Het project ‘Tag de tekst’ is een samenwerking van de leveranciers Picturae, Aincient, Sioux LIME en Islands of Meaning met als doel nieuwe dienstverlening te ontwikkelen vóór- en samen met het Stadsarchief Amsterdam, Noord-Hollands Archief en Nationaal Archief. Het project wordt mede mogelijk gemaakt door het SBIR-programma voor innovatie van de Rijksdienst voor Ondernemend Nederland.