Toward diversification of bilingual acquisition research: insights from heritage bilingualism

Professor of Linguistics and Modern Languages

Childhood Bilingualism Research Centre, Chinese University of Hong Kong

Abstract in English: This paper discusses issues of language diversity and inclusion in the context of bilingual language acquisition with a focus on heritage language speakers and recent efforts toward diversification drawing on the work conducted by the Childhood Bilingualism Research Centre (CBRC) at Chinese University of Hong Kong. I will first comment on the lack of diversity and representation in language acquisition research in general (Kidd and Garcia 2022) and bilingual acquisition in particular (Yip and Matthews 2022). 

Given 7000 languages, there are over 24 million possible language pairs which bilingual children might acquire (Yip, Mai and Matthews 2018). In the CHILDES database (MacWhinney 2000), the world’s largest repository for data of child language acquisition, English and Indo-European languages dominate: even non-Indo-European languages are typically paired with an Indo-European language, and the proportion of pairs including a non- Indo-European language has remained at around 30% over the past 10 years. Only major non-Indo-European languages are represented, with minority and endangered languages especially underrepresented (Matthews and Yip 2022).

Whether in bilingual, multilingual or heritage language acquisition, the current trend is to move away from the monolingual norm based on the ideal hearer-speaker toward a more complex understanding of how languages interact and come in contact in the mind. The issue of monolingualism as the norm and the use of monolinguals as controls (Rothman et al 2022) will be taken up. Greater diversity is needed in the heritage languages represented, language pairs and contexts of acquisition.

Against this background, I will discuss the contributions made by CBRC to the diversification of the database for bilingual and heritage language research in the creation of multimedia corpora. Examples will be drawn from Chinese-English languages pairs in homeland and heritage contexts (Yip and Matthews 2007, Mai, Matthews and Yip 2018). To work toward diversification, we promote the study of pairs involving dialects like Cantonese and Mandarin that are often mistaken for variants of the same language, and acknowledging that bilingual acquisition contexts such as Hong Kong are in fact trilingual or multilingual.

 

Résumé en français : Cette plénière aborde les questions de la diversité et de l’inclusion linguistiques dans le contexte de l’acquisition d’une langue bilingue, en mettant l’accent sur les locuteurs de langues d’origine et sur les récents efforts de diversification, en s’appuyant sur les travaux menés par le Childhood Bilingualism Research Centre (CBRC) de la Chinese University of Hong Kong. Je commencerai par commenter le manque de diversité et de représentation dans la recherche sur l’acquisition des langues en général (Kidd et Garcia 2022) et l’acquisition bilingue en particulier (Yip et Matthews 2022).

Compte tenu de 7000 langues, il existe plus de 24 millions de paires de langues possibles que les enfants bilingues pourraient acquérir (Yip, Mai et Matthews 2018). Dans la base de données CHILDES (MacWhinney 2000), le plus grand dépôt mondial de données sur l’acquisition des langues par les enfants, l’anglais et les langues indo-européennes dominent : même les langues non indo-européennes sont généralement appariées avec une langue indo-européenne, et la proportion de paires comprenant une langue non indo-européenne s’est maintenue à environ 30 % au cours des dix dernières années. Seules les principales langues non indo-européennes sont représentées, les langues minoritaires et menacées étant particulièrement sous-représentées (Matthews et Yip 2022).

Que ce soit dans le cadre de l’acquisition de langues bilingues, multilingues ou patrimoniales, la tendance actuelle est de s’éloigner de la norme monolingue basée sur l’auditeur-locuteur idéal pour s’orienter vers une compréhension plus complexe de la manière dont les langues interagissent et entrent en contact dans l’esprit. La question du monolinguisme comme norme et de l’utilisation de monolingues comme témoins (Rothman et al 2022) sera abordée. Une plus grande diversité est nécessaire dans les langues d’origine représentées, les paires de langues et les contextes d’acquisition.

Dans ce contexte, je discuterai des contributions apportées par le CBRC à la diversification de la base de données pour la recherche sur les langues bilingues et d’origine dans la création de corpus multimédia. Des exemples seront tirés de paires de langues chinois-anglais dans des contextes de patrie et de patrimoine (Yip et Matthews 2007, Mai, Matthews et Yip 2018). Dans un souci de diversification, nous encourageons l’étude de paires impliquant des dialectes tels que le cantonais et le mandarin, souvent confondus avec des variantes d’une même langue, et reconnaissons que les contextes d’acquisition bilingues tels que Hong Kong sont en fait trilingues ou multilingues.

Resumen en español: Este artículo analiza las cuestiones relacionadas con la diversidad y la inclusión lingüísticas en el contexto de la adquisición de lenguas bilingües, centrándose en los hablantes de lenguas de herencia y en los recientes esfuerzos hacia la diversificación, a partir del trabajo realizado por el Centro de Investigación sobre Bilingüismo Infantil (CBRC) de la Universidad China de Hong Kong. En primer lugar, comentaré la falta de diversidad y representación en la investigación sobre la adquisición de lenguas en general (Kidd y Garcia 2022) y la adquisición bilingüe en particular (Yip y Matthews 2022). 

Dado que existen aproximadamente 7000 lenguas en el planeta, hay más de 24 millones de posibles pares de lenguas que los niños bilingües podrían adquirir (Yip, Mai y Matthews 2018). En la base de datos CHILDES (MacWhinney 2000), el mayor repositorio mundial de datos sobre la adquisición de lenguas por parte de los niños, predominan el inglés y las lenguas indoeuropeas: incluso las lenguas no indoeuropeas suelen emparejarse con una lengua indoeuropea, y la proporción de pares que incluyen una lengua no indoeuropea se ha mantenido en torno al 30% en los últimos 10 años. Sólo están representadas las principales lenguas no indoeuropeas, y las minoritarias y en peligro de desaparición están particularmente infrarrepresentadas (Matthews y Yip 2022).

Ya sea en la adquisición de lenguas patrimoniales, o en contexto bilingüe o multilingüe , la tendencia actual es alejarse de la norma monolingüe basada en el oyente-hablante ideal hacia una comprensión más compleja de cómo las lenguas interactúan y entran en contacto en la cognición. Se abordará la cuestión del monolingüismo como norma y el uso de monolingües como control (Rothman et al 2022) y se hará hincapié en la necesidad de una mayor diversidad en las lenguas patrimoniales representadas, los pares de lenguas y los contextos de adquisición.

En este contexto, analizaré las contribuciones del CBRC a la diversificación de la base de datos para la investigación bilingüe y de lenguas patrimoniales en la creación de corpus multimedia. Se tomarán ejemplos de pares de lenguas chino-inglés en contextos patrios y patrimoniales (Yip y Matthews 2007, Mai, Matthews y Yip 2018). Para trabajar en la diversificación, promovemos el estudio de pares que incluyan dialectos como el cantonés y el mandarín que a menudo se confunden con variantes de la misma lengua, reconociendo, además, que los contextos de adquisición bilingüe como Hong Kong son de hecho trilingües o multilingües.

Zusammenfassung auf Deutsch: In diesem Beitrag werden Fragen der Sprachenvielfalt und -integration im Zusammenhang mit dem bilingualen Spracherwerb erörtert, wobei der Schwerpunkt auf Sprechern von Herkunftssprachen und den jüngsten Bemühungen um Diversifizierung liegt, die sich auf die Arbeit des Childhood Bilingualism Research Centre (CBRC) der Chinese University of Hong Kong stützen. Zunächst möchte ich auf den Mangel an Vielfalt und Repräsentation in der Spracherwerbsforschung im Allgemeinen (Kidd und Garcia 2022) und im bilingualen Erwerb im Besonderen (Yip und Matthews 2022) eingehen. 

Bei 7000 Sprachen gibt es über 24 Millionen mögliche Sprachpaare, die zweisprachige Kinder erwerben könnten (Yip, Mai und Matthews 2018). In der CHILDES-Datenbank (MacWhinney 2000), dem weltweit größten Datenspeicher für den kindlichen Spracherwerb, dominieren Englisch und indoeuropäische Sprachen: Selbst nicht-indoeuropäische Sprachen werden typischerweise mit einer indoeuropäischen Sprache gepaart, und der Anteil der Paare, die eine nicht-indoeuropäische Sprache enthalten, ist in den letzten zehn Jahren bei etwa 30 % geblieben. Nur die wichtigsten nicht-indoeuropäischen Sprachen sind vertreten, wobei Minderheiten- und gefährdete Sprachen besonders unterrepräsentiert sind (Matthews und Yip 2022).

Unabhängig davon, ob es sich um den Erwerb von zwei oder mehreren Sprachen oder um das Erlernen von Sprachen des kulturellen Erbes handelt, geht der aktuelle Trend weg von der monolingualen Norm, die auf dem idealen Hörer/Sprecher basiert, hin zu einem komplexeren Verständnis davon, wie Sprachen interagieren und im Geist in Kontakt treten. Die Frage der Einsprachigkeit als Norm und des Einsatzes von einsprachigen Sprechern als Kontrolle (Rothman et al. 2022) wird aufgegriffen. Die Vielfalt der vertretenen Sprachen, Sprachpaare und Erwerbskontexte muss erhöht werden.

Vor diesem Hintergrund werde ich die Beiträge der CBRC zur Diversifizierung der Datenbank für die zweisprachige Forschung und die Erforschung des Sprachguts bei der Erstellung von Multimedia-Korpora erörtern. Als Beispiele werden chinesisch-englische Sprachpaare im Heimatland- und Kulturerbe-Kontext herangezogen (Yip und Matthews 2007, Mai, Matthews und Yip 2018). Um auf eine Diversifizierung hinzuarbeiten, fördern wir die Untersuchung von Paaren mit Dialekten wie Kantonesisch und Mandarin, die oft fälschlicherweise für Varianten derselben Sprache gehalten werden, und gehen dabei davon aus, dass zweisprachige Erwerbskontexte wie Hongkong in Wirklichkeit dreisprachig oder mehrsprachig sind.

References

  • Mai, Ziyin, Stephen Matthews and Virginia Yip. 2018. Child Heritage Chinese Corpus. Downloadable at the CHILDES website: https://childes.talkbank.org/access/Biling/CHCC.html
  • Matthews, Stephen and Virginia Yip. 2022. Language diversity and bilingual first language acquisition. Poster presented at the 14th Conference of the Association for Language Typology (ALT 2022), University of Texas at Austin, USA.
  • Yip, Virginia, Ziyin Mai and Stephen Matthews. 2018. CHILDES for bilingualism. In D. Miller, F. Bayram, J. Rothman and L. Serratrice (eds.) Bilingual Cognition and Language: The State of the Science Across its Subfields. Amsterdam: John Benjamins.
  • Yip, Virginia and Stephen Matthews. 2007. The Bilingual Child: Early Development and Language Contact. Cambridge: Cambridge University Press.
  • Yip, Virginia and Stephen Matthews. 2022. Language diversity and bilingual first language acquisition: A commentary on Kidd and Garcia (2022). First Language 42.6. 832–836. https://doi.org/10.1177/01427237221097581