Springe direkt zu Inhalt

Guaraní

(Diese Seite ist derzeit in Bearbeitung. Da das Corpus für Guaraní im Refubium noch nicht fertig ist, führen die Verlinkungen zum Refubium aktuell zu unserem Corpus für Quechua.)

In Paraguay und in den benachbarten Regionen umliegender Länder ist Guaraní eine weiterhin viel gesprochene Sprache mit ungefähr 6,5 Millionen Sprechern.

Wir haben dieses Korpus erstellt mit Tonaufnahmen von Sprechern des Guaraní, die unter anderem zusammen Maptask bearbeiten oder 'Wer bin ich' spielen. (Eine vollständige Liste der Experimente mit Erklärungen findet sich auf der Hauptseite.) Hier (und weiter unten) finden Sie einen Link zum Refubium, auf dem die gesamten Tonaufnahmen mitsamt Transkription, Übersetzung und Glossierung vorliegen. Hier ist ein Beispielausschnitt aus einer der Tonaufnahmen ('Wer bin ich'):

Anbei die ersten zwei Äußerungen des Beispiels in aufbereiterer Form, wie sie im Korpus vorkommen.


Äußerung: che aikuaa peteï médicape la aikuaa.                                            la otra kláse ndaikuaái.
Segm.:      che ai-kuaa peteĩ médika-pe la-ai-kuaa.                                        la-otra-kláse nd-ai-kuaá-i
Gloss.:      1.SG 1.SG.ACT-saber uno médica-LOC REL-1.SG.ACT-saber. DET-otra-clase NEG-1.SG.ACT-saber-NEG
Übersetz.: yo le conozco a una, a una médica la conozco.                           otra clase no conozco

Pers.1: che aikuaa peteï médicape la aikuaa. la otra kláse ndaikuaái. nañe'ëiva voi che avavéndi, che che añónte voi aiko ógape... ha la ndaikuaái la fubolista kuéragui mba'eve ni la bailarina kuéragui.
Pers.2: médika upéicharö... héra Norma
Pers.1: ndaha'éi
Pers.2: Nidia
Pers.1: easerta

Hier ist der Link auf das Refubium. In dem Corpus sind die Experimente (anders als im obigen Beispiel) im .wav Format. Genauere Informationen über die verwendeten Experimente erhalten Sie auf der Hauptseite. Die verwendeten Sprachexperimente sind Imagenes (Objekte benennen), Memoria (Memoriespiel), Maptask (trügerische Wegbeschreibung), Cuento (stille Post), Quién ('Wer bin ich')

Jedes Einzelcorpus ist im Repositorium durch 4 Dateien repräsentiert:

1. Die Sprachaufnahme selbst, in der Regel die Aufnahme eines einzelnen Experiments, im Format 16-bit PCM .wav.

2. Eine Datei im Format .eaf, die eine auf der Ebene der Äußerung zeitlich mit der Audioaufnahme alignierte Transkription und Glossierung sowie eine Übersetzung auf Spanisch und Englisch enthält (wenn die Aufnahme selbst auf Spanisch oder Portugiesisch ist, fällt die Glossierung weg). Das .eaf-Format gehört zum Annotationsprogramm ELAN, das vom Max-Planck-Institut für Psycholinguistik entwickelt wurde und hier frei erhältlich ist: https://tla.mpi.nl/tools/tla-tools/elan/

3. Eine Datei mit den gleichen Informationen im .TextGrid-Format. Das .TextGrid-Format gehört zum Programm Praat, das von Paul Boersma und David Weenink an der Universität Amsterdam entwickelt wurde und die gängigste Software zur Analyse von Sprachdaten in der Phonetik und Phonologie ist. Praat ist ebenfalls frei erhältlich: http://www.fon.hum.uva.nl/praat/

4. Eine Datei im Format .pdf mit Metadaten zu der Aufnahme, die Informationen zum Experiment und den Sprechenden enthält.