Korpora und IT
Korpora
- Repository des HZSK - Hamburger Zentrum für Sprachkorpora
Das digitale Repositorium beim FDR des Hamburger Zentrums für Sprachkorpora dient der Archivierung, Pflege, Distribution und Erschließung von linguistischen Ressourcen, v.a. von Korpora gesprochener Sprache. Diese bestehen in der Regel aus komplexen und miteinander verbundenen Audio- und/oder Videoaufnahmen, Transkripten sowie weiteren Daten und strukturierten Metadaten.
Die Korpora behandeln schwerpunktmäßig das Thema Mehrsprachigkeit und sind grundsätzlich frei verfügbar für Wissenschaft und Lehre.
- EXMARaLDA
EXMARaLDA ist ein System für das computergestützte Arbeiten mit (vor allem) mündlichen Korpora. Es besteht aus einem Transkriptions- und Annotationseditor (Partitur-Editor), einem Tool zum Verwalten von Korpora (Corpus-Manager) und einem Such- und Analysewerkzeug (EXAKT).
Vorteile des EXMARaLDA-Systems umfassen zum Beispiel:
- zeitalignierte Transkription von Audio- oder Videodaten;
-
flexible Annotation nach frei wählbaren Analysekategorien;
-
systematische Dokumentation eines Korpus durch Metadaten;
-
flexible Ausgabe von Transkriptdaten in verschiedenen Formen und Formaten (Notation, Dokument);
-
computergestützte Recherche in Transkriptions-, Annotations und Metadaten;
-
interoperabel, da das System mit XML-basierten Dateiformaten arbeitet, die einen Datenaustausch mit anderen Tools (wie Praat, ELAN, Transcriber etc.) sowie eine flexible Verarbeitung und eine nachhaltige Nutzung der Daten ermöglichen.
EXMARaLDA wird weltweit von Forschern in unterschiedlichsten Zusammenhängen zur Analyse gesprochener Sprache eingesetzt, z.B.:
-
Gesprächsforschung (Diskurs- und Konversationsanalyse),
-
Mehrsprachigkeits- und Spracherwerbsforschung,
-
Phonetik und Phonologie
-
Dialektologie und Soziolinguistik.
EXMARaLDA wurde ursprünglich im Teilprojekt “Computergestützte Erfassungs- und Analysemethoden multilingualer Daten” des Sonderforschungsbereichs “Mehrsprachigkeit” (SFB 538) der Universität Hamburg entwickelt. Seit Juli 2011 wird die Entwicklung im Hamburger Zentrum für Sprachkorpora, seit November 2011 in Zusammenarbeit mit dem Archiv für Gesprochenes Deutsch am IDS Mannheim, weitergeführt.
- DGD – Datenbank für gesprochenes Deutsch des IdS Mannheim
Die DGD wird für Forschung und Lehre bereitgestellt. Das System ermöglicht den Zugriff auf ausgewählte Korpora des Archivs für Gesprochenes Deutsch (AGD), u.a. auf:
-
das "Forschungs und Lehrkorpus gesprochenes Deutsch" (FOLK)
-
das Korpus "Deutsche Mundarten" (Zwirner-Korpus)
-
das Korpus "Deutsche Umgangssprachen" (Pfeffer-Korpus)
Aus rechtlichen Gründen wird um eine einmalige kostenlose Registrierung gebeten. Vor der Registrierung kann man sich anhand des Menüpunktes "Über die DGD" über das Angebot der DGD informieren.
- Kobalt-DaF (HU Berlin):
Kobalt-DaF ist als ein wissenschaftliches Netzwerk entstanden, das SprachwissenschaftlerInnen verbindet, die gemeinsam Eigenschaften von schriftlichen Lernertexten untersuchen. Die Beteiligten sind ausgewiesene Experten der Fachgebiete Deutsch als Fremdsprache bzw. Korpuslinguistik und bringen unterschiedliche Expertisen in das Netzwerk ein: Es handelt sich um Fachleute in der Spracherwerbsforschung sowie Fachdidaktik Deutsch als Fremdsprache, um Fachleute in der Erstellung und Nutzung annotierter Korpora sowie für statistische Auswertungen. Hier geht es zur Mitgliederliste.
Im Rahmen des Netzwerks wurde ein reichhaltig annotiertes Lernerkorpus "Kobalt-DaF" mit argumentativen Texten von chinesischen, russischen und schwedischen MuttersprachlerInnen sowie Vergleichstexten von deutschen MuttersprachlerInnen erstellt. Mit diesem Korpus können verschiedenste grammatische Phänomenanalysen durchgeführt werden und Korrelationen sowie Transfer-Effekte aus den jeweiligen Erstsprachen der Probanden phänomenübergreifend sichtbar gemacht werden.
Das Korpus steht der Forschungsgemeinschaft frei zur Verfügung (s.u.: "Online-Abfrage").
IT
Sie haben konzeptionelle Fragen zum IT-Einsatz in den Sprach-, Literatur- und Medienwissenschaften oder zur IT-Technik an den Arbeitsplätzen und in den Seminarräumen der Fachbereiche Sprache, Literatur und Medien (SLM) I und II? Das Team der Informationstechnologie SLM steht Ihnen zur Seite.