Tag de tekst

Tag de tekst (Notariƫle akten en VOC-archieven uit het Stadsarchief Amsterdam, Noord-Hollands Archief, Nationaal Archief en Regionaal Historische Centra)

Stand van zaken

  • 10.549 scans
  • 170 deelnemers

Project info

Notariële akten en VOC-archieven doorzoekbaar maken door Artificial Intelligence (AI) te trainen

Tag (annoteer) persoonsnamen, locaties en tijdsaanduidingen in teksten die al getranscribeerd zijn en train zo Artificial Intelligence (AI) om deze entiteiten te vinden. De Nederlandstalige teksten komen uit de 17e eeuw tot en met de 19e eeuw. Het gaat om notariële teksten uit Amsterdam, Haarlem en uit andere provincies en archieven van de VOC, afkomstig uit het Stadsarchief Amsterdam, Noord-Hollands Archief, Nationaal Archief en Regionaal Historische Centra. Dit project stelt ons in staat om handgeschreven teksten veel gedetailleerder doorzoekbaar te maken, bijvoorbeeld op  locaties.

De archieven van het Nationaal Archief, Stadsarchief Amsterdam, Noord-Hollands Archief en Regionaal Historische Centra zijn zo omvangrijk dat het nog tientallen jaren zal duren voordat deze geheel door mensen geannoteerd (getagd) kunnen worden.  De inzet van AI kan helpen om sneller op te schalen. Wat wij gaan doen in dit project is het taggen van persoonsnamen, locaties en datums (entiteiten) in reeds getranscribeerde teksten. Met deze tags trainen we AI om deze entiteiten te herkennen in teksten die nog niet door mensen zijn getagd. Dit stelt ons in staat scans met transcripties te ontsluiten en doorzoekbaar te maken op onder andere persoonsnamen, locaties en datums. Niet alleen van de archieven die meedoen aan dit project, maar op den duur ook elk Nederlands archief. 


Wat gaan we doen?

In het project ‘Tag de tekst’ gaan we duizenden Nederlandstalige teksten uit de 17e eeuw tot en met de 19e eeuw taggen (annoteren). Het gaat om notariële teksten uit Amsterdam, Haarlem en uit andere provincies en archieven van de VOC. Deze zijn afkomstig uit het Stadsarchief Amsterdam, Noord-Hollands Archief, Nationaal Archief. De teksten die worden getagd op persoonsnamen, locaties en tijdsaanduidingen vormen trainingsmateriaal voor AI.  


Voor wie is het?

Onze verwachting is dat iedereen met historische interesse mee kan doen. De transcripties zijn al gemaakt en worden gebruikt om te taggen. 


Hoe werkt het?

De teksten zijn onderverdeeld in per archief: 

  • VOC Nationaal Archief
  • Notarieel Stadsarchief Amsterdam
  • Notarieel Noord-Hollands Archief
  • Notarieel Regionaal Historische Centra

Onder het tabblad ‘Voorkeuren’ kunt u uw persoonlijke voorkeuren vastleggen. Het is natuurlijk ook mogelijk om geen voorkeur in te vullen.


De drie tags 

We gebruiken drie verschillende tags: locatie, persoonsnaam en tijd. Hieronder lichten we de verschillende tags een voor een toe. Een uitgebreide beschrijving van hoe te taggen is te vinden in de invoerinstructie.
 

Locatie (Locatie-aanduiding)

Wanneer een werelddeel, land, regio, plaatsnaam, straatnaam, naam van een rivier, zee, berg, eiland of naam van een (bekende) locatie wordt genoemd, tagt u dit stukje tekst als locatie. Dit kan bijvoorbeeld ook de naam zijn van een gebouw, zoals de St. Laurenskerk of de Domkerk, of van een huis of herberg. Het gaat erom dat de locatie een naam heeft. 

Persoonsnaam (Persoonsnaam-aanduiding)

Wanneer de naam van een persoon wordt genoemd, tagt u dit stukje tekst als persoonsnaam.

Tijd (Tijds-aanduiding)

Wij verstaan onder tijds-aanduiding beschrijvingen van tijd in de tekst in de vorm van dag, maand en/of jaar.



Wat levert het u op?

Voor elke ingevoerde akte krijgt u 2 punten. Verdiende punten zijn in te wisselen voor bezoek aan evenementen bij één of meerdere van de archieven. Gedurende de loop van het project zullen de diverse mogelijkheden worden gedeeld om verdiende punten te verzilveren. 

 
Vragen?

We helpen elkaar op weg in het forum. U kunt via het forum de projectbeheerders Heleen Wilbrink en Philip Ruijten vragen stellen.