Romania Amerindia

Das gesamte Kartenmaterial wurde von uns auf Basis der Informationen von der OpenSource-Quelle <https://native-land.ca/> hergestellt. Native Land wird von indigenen Mitarbeiter*innen betrieben und stetig aktualisiert — Languages and regions where we research. All map material was produced by us on the basis of information from the open source (https://native-land.ca/). Native Land is mostly run by indigenous staff and is constantly updated.

Beschreibung des Projekts

In diesem Forschungsbereich untersuchen wir auf empirischer Basis die sprachliche Realität von ausgewählten Regionen in Südamerika, in denen Spanisch und Portugiesisch zusammen mit amerindischen Sprachen gesprochen werden¹. Wir verfolgen dabei zwei wesentliche Ziele. Einerseits stellen wir Daten amerindischer Sprachen in einer Weise zur Verfügung, die es Linguisten² weltweit ermöglichen soll, diese Sprachen in ihre Forschungsperspektiven zu integrieren. Damit wollen wir dazu beitragen, die typologische Basis der Theoriebildung zu erweitern. Gleichzeitig sollen diese Sprachen und die von ihnen ausgedrückten Lebensformen durch ihre linguistische Profilierung in Zeiten ihrer extremen Bedrohung sichtbarer gemacht werden (http://gbs.uni-koeln.de).

Das zweite Ziel betrifft den Schwerpunkt unserer eigenen deskriptiven und theoretischen Arbeit. Wir wollen ein besseres Verständnis des Zusammenspiels sprachlicher Mittel zur Bearbeitung des präsupponierten gemeinsamen Wissens (Common Ground, Stalnaker 2002) erreichen. Diese Perspektive erfordert eine gleichzeitige Erfassung lexikalischer, morphologischer, syntaktischer und prosodischer Techniken.

Die prosodische Form einer Äußerung soll aus dem Zusammenspiel metrischer, rhythmischer und intonatorischer Regeln oder Beschränkungen erklärt werden, die auf unterschiedliche Weise von einzelsprachlichen und universalen Kompetenzen mehrsprachiger Sprecher und Sprecherinnen bestimmt werden.

¹Als amerindische Sprachen bezeichnen wir alle Sprachen, die sich direkt aus den Sprachen entwickelt haben, die vor der Ankunft der ersten Europäer in den Amerikas gesprochen wurden, ohne damit die Existenz der unter diesem Namen von Greenberg (1987) vorgeschlagenen Makrofamilie behaupten zu wollen. Der Begriff ist etwas präziser als indigen und weniger kolonialistisch als indianisch.

²Auf diesen Seiten verwenden wir das generische Maskulinum in einem Verständnis, das allen Genderkonstruktionen gerecht werden soll und, um eine leichte Lesbarkeit sowie Übersetzbarkeit zu garantieren.

Teilprojekte

Das Projekt wurde von 2015 bis 2021 durch die Deutsche Forschungsgemeinschaft gefördert (DFG-Projektnummer 274614727). In der ersten Phase des Projekts (2015–2017) wurde die Prosodie des Quechua von Conchucos in der Provinz Ancash in Peru empirisch erfasst und theoretisch ausgeleuchtet. In der zweiten Projektphase (2018–2021) wurde das Projekt auf Guaraní & Spanisch in Asunción (Paraguay) und Nheengatú & Portugiesisch in São Gabriel da Cachoeira (Brasilien) ausgeweitet. Derzeit bereiten wir einen Neuantrag vor, um die komplexe Mehrsprachigkeit in dieser letzteren Region intensiver erforschen zu können.

Die Erstellung und Veröffentlichung von Sprachkorpora ist langwierig und verlangt viele Arbeitsschritte: Die Experimente müssen designt, erprobt und mit lokalen Experten angepasst werden. Materialien müssen erstellt werden. Die Aufnahmen müssen technisch sauber durchgeführt werden. Dann folgt die linguistische Aufbereitung: Transkription, Übersetzung und Glossierung nach einheitlichen und nachvollziehbaren Kriterien (so weit wie möglich an den Leipzig Glossing Rules orientiert³). Schließlich müssen die Daten technisch so aufbereitet werden, dass sie für eine Onlineveröffentlichung tauglich sind. All das erfordert viele Beteiligte, die alle ihren wichtigen Beitrag leisten. Unser Dank geht an alle!

Sprache	Land	Mitwirkende
Guaraní und Spanisch in Asunción	Paraguay	Hedy Penner, Élodie Blestel (U Paris III), Irene E. Serna Lehmann (FU Berlin)
Nheengatú und Portugiesisch am Rio Negro	Brasilien	Antônio Lessa, André Amorim, Jan Potthoff (FU Berlin), Edson Baré, Dime Baré, Dadá Baniwa, Bárbara Heliodora Lemos de Pinheiro Santos
Quechua und Spanisch in Conchucos	Peru	Raúl Italo Bendezú Araujo, Timo Buchholz, Gabriel Barreto, Leonel Menacho, Elizabeth Pankratz, Irene E. Serna Lehmann (FU Berlin)

³Die morphologischen Glossen sind stets eine Annäherung an das strukturelle Verständnis zu einem bestimmten Zeitpunkt. Andere Lesarten sind nicht auszuschließen und sollten uns ggf. mitgeteilt werden.

Aktuelles vom Projekt: Publikationen, Neuigkeiten

2023:
- 05.06.2023: Die Daten aus São Gabriel da Cachoeira (Nheengatú / Portugiesisch) sind im Refubium online und ab jetzt für alle frei zugänglich.
- 26.05.2023: Die Daten aus Asunción (Spanisch) sind im Refubium online und ab jetzt für alle frei zugänglich.
- 16.05.2023: Die Daten aus Asunción (Guaraní) sind im Refubium online und ab jetzt für alle frei zugänglich.
- Reich, Uli. 2023. System consistency across named languages in the Andes. In Pomino, Natascha et al. (eds.) Formal Linguistic Theory to the Art of Historical Editions The Multifaceted Dimensions of Romance Linguistics.Wien: Vienna University Press.
2022:
- Buchholz, Timo, Raúl Bendezú & Uli Reich. Eingereicht. Spanish in contact with Quechua in Northern Peru. In Cerno, Leonardo et al. (eds.). Contact varieties of Spanish and Spanish-lexified contact varieties. Berlin: Mouton de Gruyter.
- Reich, Uli. Eingereicht. Language contact and prosody. In Cerno, Leonardo et al. (eds.). Contact varieties of Spanish and Spanish-lexified contact varieties. Berlin: Mouton de Gruyter.
- 29.04.2022: Disputation von Timo Buchholz "Intonation between Phrasing and Accent: Spanish and Quechua in Huari".
2021:
- Gabriel, Cristoph & Uli Reich. 2021. The phonology of Romance contact varieties. Manual of Romance Phonetics and Phonology, 462–502. https://doi.org/10.1515/9783110550283-016
- 13.09.2021: Disputation von Raúl Italo Bendezú Araujo "Identificación y aserción en la marcación del foco del Quechua de Conchucos (Áncash, Perú)".
- 10.02.2021: Der zweite Teil der Conchucos-Daten (Spanisch) ist im Refubium online und ab jetzt für alle frei zugänglich.
2019:
- 27.11.2019: Veröffentlichung in der TAZ über die Gefährdung der kulturellen Diversität Brasiliens unter Bolsonaros Regierung.
- 28.10.2019: Der erste Teil der Conchucos-Daten (Quechua) ist im Refubium online und ab jetzt für alle frei zugänglich.
- August-Oktober 2019: Guaraní-Aufnahmen in Asunción, Paraguay (Uli Reich und Élodie Blestel), sowie Nheengatu-Aufnahmen São Gabriel da Cachoeira, Brasilien (Uli Reich und Antônio Lessa).
- 23.04.2019: Veröffentlichung in der FU-Tagesspiegel-Beilage über indigene Sprachen und die Arbeit des Projekts.
2018:
- Buchholz, Timo & Uli Reich. 2018. The realizational coefficient: Devising a method for empirically determining prominent positions in Conchucos Quechua. In Ingo Feldhausen, Jan Fliessbach & Maria d. M. Vanrell (eds.), Methods in prosody: A Romance language perspective (Studies in Laboratory Phonology 6), 123–164. Berlin: Language Science Press. (available here / publication website)
- Reich, Uli. 2018. Presupposed Modality. In Marco García García & Melanie Uth (eds.), Focus realization in Romance and beyond (Studies in language companion series Volume 201), 203–227. Amsterdam, Philadelphia: John Benjamins. (publication website)

Art und Struktur der Aufnahmen

Wir erreichen eine hohe Vergleichbarkeit der Daten, indem wir in allen Gemeinschaften die gleichen Aufnahmeverfahren durchführen, die typische konversationelle Züge zur Bearbeitung des Common Ground kontrolliert elizitieren. Dabei geben wir kommunikativen Spielen, in denen Kontext, diskursiver Verlauf und das lexikalische Material kontrolliert werden, den Vorrang vor sehr stark auf Satzebene kontrollierenden Verfahren wie die Elizitation von vollständig vorgegebenen Äußerungen oder Discourse Completion Tasks, da solche Experimente für die Sprechenden sehr ungewohnt sind und wir möglichst natürliche Sprachdaten erstellen wollen. Bei jedem Experiment lösen die Sprechenden unterschiedliche kommunikative Aufgaben in Form eines Spiels und werden dabei aufgenommen. Alle zweisprachigen Sprechendenn führen jedes Experiment zweimal durch, einmal in ihrer lokalen nichtromanischen und einmal in ihrer lokalen romanischen Varietät. Durch die Auswahl der Materialien (siehe "Metrische Kontrolle für die Experimentmaterialien" auf Spanisch oder Englisch), die für jede Sprache und jede Region sorgfältig und unter starker Einbeziehung lokaler Experten angepasst werden, sowie die Vorgaben ( es / en / pt ) durch die Spielregeln behalten wir eine gewisse inhaltliche Kontrolle des jeweiligen Gesprächs als Ganzem, aber Inhalt und Form jeder einzelnen Äußerung sind jeweils spontan von den Sprechenden gewählt. Zusammen mit den Kooperationspartnern in den jeweiligen Ländern und Regionen haben wir uns auf einen Kern an gemeinsamen Experimenten geeinigt. Diese sind teilweise allgemein bekannt, teilweise der linguistischen Literatur entnommen und teilweise speziell von uns entwickelt worden. Im Folgenden werden die einzelnen Experimente kurz vorgestellt. Ausführlichere Experimentbeschreibungen (auf Spanisch, Englisch und Portugiesisch) sind verlinkt.

Gemeinsame Experimente

Memoria/Concurso ( es / en / pt ): Die Sprechenden spielen eine Version des bekannten Spiels Memory, in dem sie die Positionen von Karten mit bestimmten Bildern identifizieren und sich merken müssen.

Maptask ( es / en / pt ): Die Sprechenden führen ein Gespräch, das eine Wegbeschreibung simuliert, aber die von ihnen verwendeten Karten stimmen nicht miteinander überein. Das Maptask-Experiment wurde ursprünglich von Anderson et al. (1991) entwickelt, deren englischsprachiges Korpus an der University of Edinburgh beheimatet und hier verfügbar ist: https://groups.inf.ed.ac.uk/maptask/

Cuento ( es / en / pt ): In einer adaptierten Version des Spiels Stille Post erzählen die Sprechenden eine Geschichte, die von den Forschenden erfunden wurde.

Quién ( es / en / pt): Die Sprechenden spielen eine Version des Spiels "Wer bin ich?", in dem einer von ihnen die Identität einer Person erraten muss, die nur dem Spielpartner bekannt ist.

Einzelne Experimente

Cajas ( es / en / pt ): Die Sprechenden versuchen, den Inhalt verschiedener Kisten zu erraten, ohne sie zu öffnen, und diskutieren und verhandeln, bis sie zu einer einvernehmlichen Lösung kommen.

Condir ( es / en / pt ): Dies ist eine angepasste Version eines soziolinguistischen Interviews mit einem Sprecher.

Imagenes ( es / en / pt ): Die Sprechenden benennen Objekte, die ihnen auf Bildkarten gezeigt werden.

Die Daten aus allen Teilprojekten werden transkribiert, ins Spanische oder Portugiesische und ins Englische übersetzt, morphologisch glossiert und mit Metadaten auf Englisch, Spanisch und Portugiesisch versehen in einem Repositorium und auf OSF zur Verfügung gestellt. Alle Informanten wurden von uns genau darüber informiert, dass die Aufnahmen für Forschungszwecken veröffentlicht werden. Von allen liegen Einverständniserklärungen vor.

Einzelcorpus

Jedes Einzelcorpus ist im Repositorium durch 4 Dateien repräsentiert:

Die Sprachaufnahme selbst, in der Regel die Aufnahme eines einzelnen Experiments, im Format 16-bit PCM .wav.
Eine Datei im Format .eaf, die eine auf der Ebene der Äußerung zeitlich mit der Audioaufnahme alignierte Transkription und Glossierung sowie eine Übersetzung ins Spanische und Englische enthält (wenn die Aufnahme selbst auf Spanisch oder Portugiesisch ist, fällt die Glossierung weg). Das .eaf-Format gehört zum Annotationsprogramm ELAN, das vom Max-Planck-Institut für Psycholinguistik entwickelt wurde und hier frei erhältlich ist: https://tla.mpi.nl/tools/tla-tools/elan/
Eine Datei mit den gleichen Informationen im .TextGrid-Format. Das .TextGrid-Format gehört zum Programm Praat, das von Paul Boersma und David Weenink an der Universität Amsterdam entwickelt wurde und die gängigste Software zur Analyse von Sprachdaten in der Phonetik und Phonologie ist. Praat ist ebenfalls frei erhältlich: http://www.fon.hum.uva.nl/praat/
Eine Datei im Format .pdf mit Metadaten zu der Aufnahme, die Informationen zum Experiment und den Sprechenden enthält.

Die im Rahmen dieses Forschungsprojekts entstandenen Sprachaufnahmen werden zusammen mit Transkriptionen, Übersetzungen und morphologischen Glossen zentral im Repositorium der Freien Universität Berlin (Refubium) gespeichert und sind öffentlich frei zugänglich und nicht kommerziell nutzbar (Creative Commons Lizenz CC BY-NC-SA 4.0). Sie sind herzlich eingeladen, mit unseren Daten eigene linguistische Forschungen durchzuführen und wir freuen uns über jede Form von Feedback (Kontakt: uli.reich@fu-berlin.de)