Springe direkt zu Inhalt

Romania Amerindia

Descrição do projeto

Nesta área de pesquisa, investigamos empiricamente a realidade linguística de regiões selecionadas da América do Sul onde o espanhol e o português são falados junto com as línguas ameríndias1. Ao fazer isso, tivemos dois objetivos principais. O primeiro de fornecermos dados sobre os idiomas ameríndios de uma forma que permitirá aos linguistas do mundo inteiro integrarem esses idiomas em suas próprias pesquisas. Ao fazer isso, queremos contribuir para propiciar uma construção teórica mais abrangente. Ao mesmo tempo, documentar esses idiomas e as formas de vida que eles retratam  torna-os mais visíveis através de seu perfil linguístico em tempos de ameaça extrema (http://gbs.uni-koeln.de/wordpress/).

O segundo objetivo diz respeito ao foco do nosso próprio trabalho teórico e descritivo. Queremos alcançar um melhor entendimento da construção conjunta do conhecimento comum (Common Ground, Stalnaker 2002), por meios linguísticos diferentes. Esta perspectiva requer uma aquisição simultânea de técnicas lexicais, morfológicas, sintáticas e prosódicas.

A forma prosódica de um enunciado deve ser explicada a partir da interação de regras ou restrições métricas, rítmicas e intonacionais, que são determinadas de diferentes maneiras por competências linguísticas  universais e específicas de cada língua para falantes multilíngues

 1Usamos o termo ameríndio para nos referirmos a todos os idiomas que evoluíram diretamente das línguas faladas nas Américas antes da chegada dos primeiros europeus, sem reivindicar a existência da macrofamília proposta sob este nome por Greenberg (1987). O termo é um pouco mais preciso do que indígena e menos colonialista do que índio.

Subprojetos

Língua País Parceirxs de cooperação

Coordenação e repositório

Germany

Raúl Italo Bendezú Araujo, Timo Buchholz, Elizabeth Pankratz

Nheengatú e Português em Rio Negro

Brazil

Antônio Lessa, André Amorim (FU Berlin), Edson Baré

Quechua e Espanhol de Conchucos

Peru

Raúl Italo Bendezú Araujo, Timo Buchholz, Gabriel Barreto, Leonel Menacho

Guaraní e Espanhol de Asunción

Paraguay

Hedy Penner, Élodie Blestel (U Paris III)

Mapudungún

Chile

Aldo Olate, Jaqueline Caniguan

Últimas notícias do projeto: publicações, novidades

 29.04.2022: Defesa de Timo Buchholz "Intonation between Phrasing and Accent: Spanish and Quechua in Huari".

13.09.2021: Defesa de Raúl Italo Bendezú Araujo "Identificación y aserción en la marcación del foco del Quechua de Conchucos (Áncash, Perú)

10.02.2021: A segunda parte dos dados do Conchucos (Espanhol 1) está online no Refubium (Repositório da Freie Universität) e, a partir de agora, livremente acessível a todos

 27.11.2019: Publicação na TAZ sobre a ameaça à diversidade cultural do Brasil sob o governo Bolsonaro.

 28.10.2019: A primeira parte dos dados do Conchucos (Quéchua 1) está online no Refubium e, a partir de agora, livremente acessível a todos

Agosto-Outubro de 2019: Uli Reich esteve em Assunção (Paraguai) com Élodie Blestel (Paris III) e em São Gabriel da Cachoeira (Brasil) com Antônio Lessa, realizando gravações em Guarani e Nheengatu para este projeto

23.04.2019: publicação no suplemento do jornal FU-Tagesspiegel sobre línguas indígenas e o trabalho do projeto

Buchholz, Timo & Uli Reich. 2018. The realizational coefficient: Devising a method for empirically determining prominent positions in Conchucos Quechua. In Ingo Feldhausen, Jan Fliessbach & Maria d. M. Vanrell (eds.), Methods in prosody: A Romance language perspective (Studies in Laboratory Phonology 6), 123–164. Berlin: Language Science Press. (link) (site do livro)

Reich, Uli. 2018. Presupposed Modality. In Marco García García & Melanie Uth (eds.), Focus realization in Romance and beyond (Studies in language companion series Volume 201), 203–227. Amsterdam, Philadelphia: John Benjamins. (site do livro)

Colaboradores Quéchua e Espanhol em Conchucos

Timo BuchholzRaúl Italo Bendezu Araujo, Elizabeth Pankratz

A criação e publicação de corpora linguísticos leva muito tempo e requer muitos passos: As experiências têm de ser concebidas e testadas e adaptadas com peritos locais. Os materiais devem ser criados. As gravações devem estar tecnicamente limpas. Segue-se a preparação linguística: transcrição, tradução e glosa, de acordo com critérios uniformes e compreensíveis (na medida do possível baseados nas Leipzig Glossing Rules). Por último, os dados devem ser tecnicamente preparados de modo a serem adequados para publicação online. Tudo isso requer a contribuição de muitos colaboradores. Os nossos agradecimentos a todos!

Diretores científicos Diretora técnica Cooperação Local (Huaraz e Huari) Transcrição e Tradução Quéchua (Huaraz) Glossário Quéchua (Lima) Transcrição e Tradução Espanhol (Berlim)

Raúl Bendezú Araujo

Timo Buchholz

Uli Reich

Elizabeth Pankratz

Gabriel Barreto

Leonel Menacho Lopez

Yuli Alicia Cadillo Tarazona

Merlín de la Cruz Huayanay

Efraín Rodolfo Montes Palacios

Leidy Felyna Rosales Gonzales

Jeny Elvira Rosas Julca

Nelson Yonatan Sánchez Evaristo

Marco Antonio Trigoso Aching

Loreta Alva Mansilla

Claudia Arbaiza Varela

Minerva Lucero Cerna Maguiña

Freyda Nisbeth Schuler Tovar

Alonso Vásquez Aguilar

Magalí Bertola

Catalina Torres Orjuela

Tipo e estrutura das gravações

Alcançamos um alto grau de comparabilidade dos dados utilizando os mesmos procedimentos de gravação em todas as comunidades, o que elicitou traços típicos de conversação para o uso do conhecimento comum (Common Ground) de forma controlada. Demos prioridade aos jogos comunicativos nos quais o contexto, o discurso e o material lexical foram controlados, para produzir os dados de linguagem mais naturais possíveis. O uso de procedimentos mais controlados no nível da oração, como a elicitação de enunciados pré-planejados ou (forced) discourse completion tasks, são pouco produtivas dentro dessas comunidades, visto que elas não conhecem essas práticas.  Em cada experimento, os participantes são gravados enquanto resolvem diferentes tarefas comunicativas na forma de um jogo. Todos os falantes multilíngues realizam cada experimento duas vezes, uma em seu idioma não-românico local e outra em sua variedade românica local. Através da escolha de materiais que foram cuidadosamente adaptados para cada idioma e região com o forte envolvimento de especialistas locais, bem como as diretrizes das regras do jogo, mantivemos um certo controle sobre o teor das conversas como um todo, mas o conteúdo e a forma de cada enunciado individual são escolhas espontâneas dos participantes. Juntamente com os colaboradores nos respectivos países e regiões, acordamos o núcleo comuns dos experimentos. Algumas delas são popularmente conhecidas, outras são retiradas da literatura linguística e outras foram especialmente desenvolvidas por nós. Os experimentos são apresentados resumidamente a seguir, cada qual com suas particularidades. Descrições mais detalhadas de experiências (em espanhol e inglês) estão linkadas.

Imagenes (spa / eng): Os falantes nomeiam os objetos que lhes são mostrados em cartões com imagens.

Memoria (spa / eng): Os falantes jogam uma versão do conhecido jogo-da-memória, no qual eles têm que identificar e lembrar as posições das cartas com determinadas figuras.

Maptask (spa / eng): O experimento Maptask foi originalmente desenvolvido por Anderson et al. (1991), cujo corpus em inglês está disponibilizado pela Universidade de Edimburgo e está disponível aqui: http://groups.inf.ed.ac.uk/maptask/

Cuento (spa / eng): Em uma versão adaptada do jogo telefone sem fio, os palestrantes contam uma história inventada pelos pesquisadores.

Quién (spa / eng): Os oradores jogam uma versão do jogo "Quem sou eu?" em que um deles tem que adivinhar a identidade de uma pessoa que só o outro conhece.

Os dados de todos os subprojetos estão transcritos, traduzidos em espanhol ou português e em inglês, morfologicamente glossados e disponibilizados com metadados em inglês, espanhol e português em um repositório e no Orcid. Cada corpus individual está identificado por um link.

 

Corpora Disponíveis

As gravações de voz produzidas como parte deste projeto de pesquisa são armazenadas centralmente no repositório da Freie Universität Berlin (Refubium), juntamente com transcrições e traduções, bem como metadados, e são assim livremente acessíveis ao público e não comercialmente utilizáveis (Creative Commons License CC BY-NC-SA 4.0). Você é muito bem-vindo para conduzir a sua própria pesquisa linguística com os nossos dados e nós ficaríamos felizes em ouvir a sua opinião, bem como com qualquer outra forma de feedback.

Cada corpus individual é representado por 4 arquivos:

1. a própria gravação da fala, geralmente a gravação de um único experimento, em formato PCM com compressão de 16 bits (WAV).

2. um arquivo em formato .eaf, que contém uma transcrição e uma glossa temporalmente alinhada com a gravação de áudio no nível de enunciado, bem como uma tradução em espanhol e inglês (se a gravação em si for em espanhol ou português, a glossa foi omitida). O formato .eaf pertence ao programa de anotação ELAN, que foi desenvolvido pelo Instituto Max Planck de Psicolingüística e está disponível gratuitamente aqui: https://tla.mpi.nl/tools/tla-tools/elan/

O ELAN pode ser usado em português. Na mesma página do MPI você também encontrará guias para usar o ELAN em inglês, e Livia Oushiro da USP escreveu um guia em português: http://projetosp2010.fflch.usp.br/sites/projetosp2010.fflch.usp.br/files/SP2010-Manual-Transcricoes.pdf

3. um arquivo com as mesmas informações em formato .TextGrid. O formato .TextGrid pertence ao programa Praat, desenvolvido por Paul Boersma e David Weenink na Universidade de Amsterdã, que é o software mais comum para análise de dados de fala em fonética e fonologia. O Praat também está disponível gratuitamente: http://www.fon.hum.uva.nl/praat/

O Praat só pode ser usado em inglês, mas em seu site também há links para guias em outros idiomas, e há um guia em português escrito por Catarina Oliveira e António Teixeira da Escola Superior de Saúde da Universidade de Aveiro: http://www.usp.br/gmhp/soft/praat.pdf

4. um arquivo em formato .pdf com metadados sobre a gravação, contendo informações sobre o experimento e os participantes.

Na tabela a seguir, você encontrará todos os corpora já publicados. O seu número aumentará progressivamente à medida que o projeto for avançando. Ao clicar no nome do corpus, você vai diretamente para a página correspondente no repositório da FU, onde você pode baixar os arquivos para cada experimento individualmente.

Corpus Região Pesquisadores Tipos de experimentos contidos Idioma(s)
Quechua 1 Conchucos, Peru

Bendezú Araujo, Raúl

Buchholz,Timo

Reich, Uli

comum:

Memoria (7x)

Maptask (7x)

Cuento (7x)

Quién (4 x)

particular:

Cajas (4x)

Condir (1x)

Quechua

O projeto foi financiado pela Fundação Alemã de Pesquisa (Deutsche Forschungsgemeinschaft, DFG) de 2015 a 2021 (projeto DFG número 274614727). Na primeira fase do projeto (2015-2017), a prosódia do Quechua de Conchucos, na província de Ancash, no Peru, foi registrada empiricamente e teoricamente esclarecida. Na segunda fase do projeto (2018-2021), o projeto foi estendido para o espanhol e guarani em Assunção/Paraguai e nheengatú e português em São Gabriel da Cachoeira/Brasil. Estamos atualmente preparando uma nova fase para poder pesquisar mais a fundo o complexo multilinguismo nesta região.

Como citar (exemplo Quechua 1, MLA): Bendezú Araujo, Raúl, Timo Buchholz & Uli Reich. 2019. Corpora amerikanischer Sprachen: Interaktive Sprachspiele aus dem mehrsprachigen Lateinamerika (Quechua 1). Berlin: Freie Universität. https://refubium.fu-berlin.de/handle/fub188/25747

Recursos