Korpus
Die Annotation der Texte umfasst:
- Tokenisierung (graphisch und syntaktisch)
- POS-Tags
- Lemmata
- Belebtheitskategorien
- Satzgrenzen
- Semantische Rollen
- Satzglieder
Die Datengrundlage im Projekt bildeten frnhd. Hexenverhörprotokolle aus der Edition von Macha et al. (2005). Aus diesen wurde ein Kernkorpus von 18 Texten erstellt, die gleichmäßig über Raum und Zeit verteilt sind.