Finnougristik/Uralistik
INEL Selkup Corpus 1.0 fertiggestellt
21. September 2020, von IFUU

Foto: Alexandre Arkhipov
Wir freuen uns mitteilen zu können, dass eine aktualisierte Version (jetzt 1.0) des INEL Selkup Corpus fertiggestellt wurde.
Brykina, Maria; Orlova, Svetlana; Wagner-Nagy, Beáta. 2020. INEL Selkup Corpus. Version 1.0. Publication date 2020-06-30. Archived in Hamburger Zentrum für Sprachkorpora. http://hdl.handle.net/11022/0000-0007-E1D5-A In: Wagner-Nagy, Beáta; Arkhipov, Alexandre; Ferger, Anne; Jettka, Daniel; Lehmberg, Timm (eds.). The INEL corpora of indigenous Northern Eurasian languages.
- Die aktuelle Veröffentlichung beinhaltet 264 Texte von 74 Sprechern für Nord-, Zentral- und Süd-Selkupische Dialekte. Insgesamt handelt es sich um 7887 Sätze und 42466 Wörter.
- Viele Texte wurden mit (partiellen) Annotationen für syntaktische Funktionen und semantische Rollen versehen.
- Korrekturen wurden durchgeführt in den Audio-Transkriptionen, Glossierungen und anderen Annotationen.
- Die Nutzerdokumentation (in englischer Sptrache) ist hier verfügbar.
- Das Korpus kann durch den Einsatz der Tsakorpus-Plattform webbasiert durchsucht werden.
Über das Korpus
Selkupisch ist eine bedrohte Samojedische Sprache (aus der Uralischen Sprachfamilie), die in vielen kleinen Siedlungen über das große Territorium Westsibiriens verteilt gesprochen wurde. Das INEL Selkup Corpus setzt sich aus Texten aus dem Archiv von Angelina Ivanovna Kuzmina (1924–2002) zusammen. Kuzmina hat eine große Menge an Material zum Selkupischen in beinahe allen Regionen, in denen Selkupen zwischen 1962 und 1977 gelebt haben, zusammengetragen. Die meisten Texte stammen aus dem handschriftlichen Teil des Archivs, welches Kuzmina 2001 nach Hamburg transferiert hat. Die weiteren Texte entstammen ihren Audioaufnahmen, die 2001 digitalisiert wurden und später im INEL Projekt transkribiert und übersetzt wurden.
Das Korpus wird veröffentlicht mit der Lizenz CC BY-NC-SA 4.0. Parallel zur Online-Suche kann ein komplettes Archiv der Korpusdateien heruntergeladen werden und mit dem Programm EXAKT aus dem EXMARaLDA-Softwaresystem durchsucht werden.
Ansichten einzelner Texte sind online verfügbar unter dem Tab "Sessions" auf der Korpusseite. Jeder Text kann in Onlineformaten direkt angesehen werden (z.B. Visualization: Score) oder im EXB-Format (EXMARaLDA-Dateiformat, konvertierbar nach ELAN) heruntergeladen werden. Die Quellen der Texte, also gescannte Seiten (PDF) oder Audiodateien (WAV, MP3) können ebenfalls angesehen und heruntergeladen werden.
Bitte zögern Sie nicht uns Ihre Kommentare und Anregungen zu senden: inel@uni-hamburg.de( inel"AT"uni-hamburg.de).