Projektberichte und erste Ergebnisse
Das Projekt startete am 01.01.2025. Momentan erstellen wir das Korpus und besprechen das weitere Vorgehen. Wir konnten allein in den Korpora des Digitalen Wörterbuchs des Deutschen bereits über 100.000 Belege für verschiedene Varianten der Kurzwörter finden.
In den letzten Monaten konnten einige Fortschritte erzielt werden. Nach der Implementierung der aus dem DWDS (Digitales Wörterbuch der Deutschen Sprache) gewonnenen Daten in die DATS (Discourse Analysis Tool Suite) des HCDS (Hub of Computing & Data Science) wurden bereits 8147 Dokumente vollständig annotiert. Erste Analysen zeigen, dass in den annotierten Daten 11.302 Belege für Kurzwörter vorkommen, zudem 1.175 Auflösungen und 82 Verweise.
Außerdem wurden verschiedene Formen der Kurzwörter sowie deren Auflösungen auf (queeren) Websites, in Satzungen von politischen Parteien und queeren Vereinen und in Glossaren erhoben. In den nächsten Monaten sollen möglichst viele Dokumente von der studentischen Hilfskraft annotiert werden. Damit soll eine breite Datengrundlage geschaffen werden, sodass weitere Daten ggf. mit KI-Unterstützung – inklusive manueller Kontrolle – annotiert werden können.