Korpus

Die Annotation der Texte umfasst:

Tokenisierung (graphisch und syntaktisch)
POS-Tags
Lemmata
Belebtheitskategorien
Satzgrenzen
Semantische Rollen
Satzglieder

Die Datengrundlage im Projekt bildeten frnhd. Hexenverhörprotokolle aus der Edition von Macha et al. (2005). Aus diesen wurde ein Kernkorpus von 18 Texten erstellt, die gleichmäßig über Raum und Zeit verteilt sind.

Protokolle

Die fettgedruckten Protokolle bilden das Kernkorpus.

Ort	Jahr	Region
Celle	1570	NW
Werl	1630	NW
Osnabrück	1636	NW
Wernigerode	1597	NW
Münster	1630	NW
Hildesheim	1628	NW
Minden	1614	NW
Flensburg	1608	NW
Crivitz	1642	NO
Ellingen	1590	SO
Göttingen	1649	NW
Helmstedt	1580	NW
Leipzig	1640	MO
Leonberg	1641	SW
Memmingen	1665	SW
Messkrich	1644	SW
Reichenberg	1653	SO
Gaugrehweiler	1610	MW
Guenzburg	1613	SW
Guestrow	1615	NO
Meldorf	1618	NW
Rosenburg	1618	MO
Schweinfurt	1616	SO
Alme	1630	NW
Baden	1628	SW
Bamberg	1628	SO
Georgenthal	1597	MO
Hamm	1592	MW
Jever	1592	NW
Lemberg	1630	MW
München	1600	SO
Ostrau	1630	MO
Perleberg	1588	NO
Riedlingen	1596	SW
Stralsund	1630	NO
Ahaus	1608	NW
Lemgo	1632	NW
Blankensee	1619	NO
Blankenheim	1629	MW
Dillenburg	1631	MW
Erkelenz	1598	MW
Friedberg	1620	MW
Höchst	1631	MW
Köln	1629	MW
Linz (Rhein)	1631	MW
Rhens	1629	MW
Wittgenstein	1629	MW
Zülpich	1629	MW
Augsburg	1625	SW
Nördlingen	1593	SW
Rosenfeld	1603	SW
Hemau	1616	SO
Meiningen	1611	SO
Mergentheim	1629	SO
Reichertshofen	1629	SO
Oldesloe	1639	NW