Methoden
Um die Publikation komplex annotierter Online-Korpora über die INEL Korpus Plattform zum Abschluss der jeweiligen Teilprojekte sicherzustellen betreibt das Projekt eine digitale Infrastruktur, die durchgehend angepasst und erweitert wird. Sie basiert auf den Vorarbeiten des Hamburger Zentrums für Sprachkorpora und beinhaltet unter anderem die folgenden Arbeitsbereiche:
- Ressourcenerstellung
Objektsprachliche Daten werden digitalisiert, (im Fall von Audiodaten) transkribiert und zeitaligniert und mithilfe etablierter Werkzeuge und Standards (bspw. EXMARaLDA und ISO-TEI) mit Metadaten angereichert, glossiert und tiefgehend annotiert. Neben Sprachkorpora entstehen weitere Ressourcen, unter anderem kartographische Daten sowie Kataloge und die INEL-Bibliographie. - Workflow Management
Ziel der Entwicklung und Anpassung digitaler Workflows ist es, eine effizientere und nutzerfreundlichere Datenaufbereitung in den Teilprojekten zu gewährleisten. Die entwickelten Workflows erweitern dabei die Arbeiten zur Korpuserstellung um Komponenten zum Monitoring, zur Versionierung, Konsistenzprüfung sowie zur Analyse und Visualisierung der im Aufbau befindlichen Sprachkorpora. - Bereitstellung von Ressourcen
Die Vorhaltung und Publikation der Projektressourcen unter Open-Access Bedingungen erfolgt unter den Gesichtspunkten der nachhaltigen Speicherung sowie der intuitiven Durchsuchbarkeit, sowohl für die internationale Community als auch für die Interessierte Öffentlichkeit. Zu diesem Zweck wird sowohl auf Repositorien am Standort Hamburg (beispielsweise am Zentrum für nachhaltiges Forschungsdatenmanagement, FDM und dem Hamburger Zentrum für Sprachkorpora, HZSK) als auch auf bestehende Lösungen zur Visualisierung und Korpussuche (TsaKorpus Plattform) zurückgegriffen.