Über das Projekt
Im Vordergrund des vom BMBF geförderten Verbundprojektes „QUEST“ steht die Erarbeitung von Qualitätsstandards und Kurationskriterien sowie die darauf aufbauende Erprobung von Methoden der Qualitätssicherung im Bereich heterogener digitaler Sprachdaten. Das Vorhaben fokussiert auf Forschungsdaten, die im Rahmen empirischer Forschung in den Bereichen Sprachdokumentation, Sprachkontakt- und Mehrsprachigkeitsforschung entstehen. Dabei handelt es sich um aufwändig aufbereitete empirische Ressourcen (Korpora), zumeist bestehend aus Audio- und/oder Videoaufnahmen, deren Transkriptionen (Verschriftlichungen gesprochener/gebärdeter Sprache) sowie weiteren Beschreibungen wie Annotationen und Metadaten zur Katalogisierung von Ressourcen und Ressourcenbestandteilen. Angesichts ihrer Heterogenität und teilweise sehr fachspezifischen Charakteristika stellen diese Ressourcen sehr hohe Anforderungen an die Definition jedweder Standards und Evaluationskriterien, die vermutlich aus diesem Grund bis zum gegenwärtigen Zeitpunkt nur unzureichend etabliert wurden. Gleichzeitig reicht das Nachnutzungspotential der Daten weit über o.g. Disziplinen hinaus, so dass die zu entwickelnden Qualitätsstandards und Kurationskriterien exemplarischen Charakter für das Forschungsdatenmanagement audiovisueller Daten in den Geisteswissenschaften im Allgemeinen besitzen werden.
Das Vorhaben gleidert sich in drei Teilziele:
- Das erste Teilziel ist eine umfassende, vom vorhandenen Datenbestand der beteiligten Forschungsdatenzentren ausgehende Bewertung und ggf. Ausdifferenzierung existierender Qualitätsstandards, d.h. existierender datentechnischer und dokumentatorischer Standards und datentypspezifische Gütekriterien, hinsichtlich ihrer Eignung und Relevanz im Kontext der Erstellung und des Deposting solcher Ressourcen.
- Aufbauend darauf steht als zweites Teilziel die Entwicklung von Kurationskriterien, d.h. Verfahren der Datenanreicherung und –transformation, die das Potential solchermaßen qualitätsgesicherter Daten im Hinblick auf eine interdisziplinäre Nachnutzung oder eine Verwendung der Daten im Rahmen einer Third Mission optimieren.
- Das dritte Teilziel ist die Implementierung konkreter Methoden der Qualitätssicherung an den beteiligten Datenzentren, die den Aufbau und die Aufbereitung audiovisueller Sprachdaten im Sinne der erarbeiteten Qualitätsstandards und Kurationskriterien leiten und unterstützen. Dabei soll ein teilautomatisches System zu Evaluation, fachspezifischem Reviewung und ggf. abschließender Zertifizierung entwickelt und erprobt werden.