Tutorials
Bitte beachten Sie die am Ende dieser Seite aufgeführten Änderungen in ANNIS 4.
1. Das ReN - Projektwebseite und Korpusstruktur
2. Zugang zum Korpus
3. ANNIS-Oberfläche
4. Transkription und Annotation
5. Suchen im ReN in ANNIS
6. Export und Frequenzanalyse
7. Beispielsuchabfragen im ReN in ANNIS
Änderungen in ANNIS 4:
Corpus List:
Die Ansicht der Korpusliste unterhalb des Suchabfragefensters hat sich ein wenig verändert. Unter Visible kann nicht mehr zwischen dem annotierten Teil des ReN (ReN-anno) und dem nur transkribierten Teil des ReN (ReN-trans) gewählt werden. Stattdessen ist nur noch „All“ aufgeführt, d. h. das gesamte Korpus aus ReN-anno plus ReN-trans. Um innerhalb der angezeigten Korpusliste eines oder mehrere Subkorpora zu aktivieren, wird einfach durch einen Klick auf das Kästchen links neben dem entsprechenden Subkorpus dieses aktiviert. Über einen Klick auf das Kästchen links oben in der Zeile Corpus können alle angezeigten Subkorpora der Liste aktiviert werden. Um systematisch mehrere Subkorpora bspw. des selben Sprachraums auszuwählen, kann außerdem die Filterfunktion genutzt werden. Gibt man z. B. bei Filter den Eintrag ostelbisch ein, erscheinen in der Liste nur noch alle Subkorpora aus dem ostelbischen Sprachraum, über einen Klick auf das oberste Kästchen können all diese Subkorpora gleichzeitig aktiviert werden. Auf diese Weise ist auch die Eingrenzung auf die Subkorpora „ReN_anno“ und „ReN_trans“ möglich, z. B. kann bei Filter der Eintrag ReN_anno gemacht werden, und es erscheinen in der Korpusliste nur noch die annotierten Teilkorpora.
Anzeige der Metadaten für einen bestimmten Text:
Um die Metadaten für den Text eines bestimmten Subkorpus in der Korpusliste einzusehen, klickt man links neben dem Namen des Subkorpus in der Korpusliste auf das Icon für den Document Browser, das wie eine Seite Papier aussieht (rechts neben dem Infobutton). Anschließend öffnet sich das Fenster, in dem die im Subkorpus enthaltenen Texte aufgeführt sind. Rechts neben der Auswahl der verschiedenen Transkriptionsansichten befindet sich die Spalte info. Klickt man hier in der Zeile des entsprechenden Textes auf den Infobutton, öffnet sich ein kleines Fenster mit den Metadaten dieses Textes. Mit der Maus kann man dieses Fenster auch größer ziehen.
Suche unter Einbeziehung von Metadaten:
Um Metadaten in die Suche einzubeziehen, muss der Teil-Von-Operator @* genutzt werden. Mit der Suchabfrage pos="PPER" @* topic_ReN="R" wird z. B. nach allen Personalpronomen in Rechtstexten gesucht (topic_ReN = Feld der Schriftlichkeit, R = Recht).
Sollen mehrere Metadaten in die Suche einbezogen werden, muss mithilfe einer Knotennummerierung für jede der Metadaten eine Referenzierung auf die gesuchte Annotation hergestellt werden, z. B. für eine Suche nach allen Personalpronomen in nordniedersächsischen Rechtstexten:
pos="PPER" & #1 @* topic_ReN="R" & #1 @* language-area=/nordniedersaechsisch/
Erweiterung der Suchmöglichkeiten:
ANNIS 4 ermöglicht eine Reihe neuer Suchen, z. B.
- die Negation von Operatoren mit Existenz (ab 4.4.0), s. https://github.com/korpling/graphANNIS/issues/186
- die Negation ohne existenten Knoten (ab 4.5.0), s. http://korpling.github.io/ANNIS/4.5/user-guide/aql/negation.html
Ergebnisanzeige einer Suchabfrage:
Grundsätzlich laufen die Suchabfragen in ANNIS 4 wesentlich schneller als zuvor in ANNIS 3 ab und es sind auch sehr komplexe Abfragen möglich. Bei einer Abfrage in sehr vielen Subkorpora oder einer sehr komplexen Abfrage kann es vorkommen, dass rechts im Ergebnisfenster bereits die Treffer aufgelistet sind, unter dem Suchabfragefenster jedoch nicht die Zahl der Treffer (matches) erscheint. In diesen Fällen muss über erneuten Klick auf den Search-Button einfach die Suchabfrage noch einmal ausgeführt werden, anschließend erscheint die Zahl der Treffer (matches) und der Texte (documents).
Frequenzanalyse:
Die Einbeziehung von Metadaten erfolgt nicht mehr über den Button Select im Eingabefenster. Der Grund liegt darin, dass Frequenzannotationen in ANNIS 4 wie ganz normale Annotationen in AQL behandelt werden. Wenn man eine Frequenzanalyse unter Einbeziehung eines Metadatums durchführen will, muss dieses Metadatum bereits mithilfe des Ausdrucks @* an die Suchabfrage angehängt werden, z. B. kann man mit pos="NE" @* abbr_ddd zunächst nach allen Eigennamen suchen, anschließend erscheint beim Öffnen der Frequenzanalyse im Eingabefenster in der Liste der Knoten neben der gesuchten Annotationsebene pos auch das Metadatum abbr_ddd (= Sigle des Textes). Um die Treffer für die Eigennamen nach den Texten filtern zu lassen, wird der Knoten pos gelöscht und anschließend die Frequenzanalyse gestartet.
Exporter:
Es gibt nur noch einen CSV-Exporter. Dieser entspricht dem CSV-Multi-Tok-Exporter in ANNIS 3.