Corpus Koiné de habla infantil

ISBN: 1-59642-273-4

El banco de datos Koiné descansa en una muestra de 71 niños (34 niños y 37 niñas) en una horquilla de edad entre los 18 y los 53 meses de edad. Los materiales comunicativos proceden de interacciones entre los participantes en contextos de Escuela Infantil en zonas urbanas y semiurbanas de Galicia. Las dinámicas adquisitivas ilustran procesos de desarrollo del gallego (son 7 los niños que se expresan en gallego) y de la variedad del español hablado en Galicia.

Cuadro 1. Datos de las guarderías seleccionadas
Guardería Titularidad Provincia Población Ubicación precisa
Breogán Pública A Coruña Santiago de Compostela Periferia; zona universitaria
Vite Pública A Coruña Santiago de Compostela Periferia; barrio clase media
Sta.Susana Pública A Coruña Santiago de Compostela Zona centro
Milagrosa Pública Lugo Lugo Periferia; barrio clase media
Elfos Privada Pontevedra A Estrada Zona centro

La recolección de interacciones comunicativas se llevó a cabo entre los años 1996-2000 en sesiones de 15-20 minutos y con cadencia quincenal, en marcos situacionales de naturalidad y de conversación espontánea. Si bien no se trata de un repertorio denso de datos, no obstante la naturaleza longitudinal de las propiedades que contiene garantiza su valor representativo. Los participantes tienen una presencia notable en la muestra evolutiva. A su vez, las interacciones comunicativas que contienen los materiales recopilados en el corpus ofrecen una distribución por franjas de edad que responde a los siguientes porcentajes:

La significación indiscutible del repertorio Koiné de habla infantil descansa en tres aspectos, alusivos todos ellos a la novedad y a las utilidades del inventario. En primer lugar, sobresalen las propiedades cuantitativas y configuracionales que hacen del banco Koiné una fuente única que provee características genuinas del proceso de adquisición del español en las etapas más tempranas. En segundo lugar es destacable la riqueza cualitativa de los datos, sobre todo en características pragmáticas. Y en tercer lugar se constatan de manera rotunda las posibilidades de explotación y de aplicación práctica de las tendencias evolutivas halladas en los datos con objeto de valorar casos concretos de desarrollo. En síntesis, la relevancia del corpus Koiné radica en que:

a) es una muestra suficiente para disponer de tendencias de referencia en las primeras etapas sobre:

b) es un escaparate que destaca indicadores pragmáticos tan interesantes como:

c) ofrece datos para cotejar y estimar la eficacia comunicativa del lenguaje utilizado por los niños en determinadas franjas de edad, lo que facilita la valoración y el contraste en casos particulares.

Etiquetado y trabajo con el corpus

El corpus Koiné de habla infantil se ha actualizado en el etiquetado de características desde su inclusión en CHILDES en 2006. En la propuesta más reciente de 2016 se han incorporado codificaciones de procesos fónicos con rendimiento notable en la emergencia de sonidos idiomáticos. Son las dinámicas de sustitución, omisión, adición, frontalización, sonorización, fricativización, procesos múltiples.

Asimismo, se añadieron los archivos sonoros de las muestras conversacionales fuente del repertorio tratados en PHONBANK.

En la versión precedente de 2014 se habían insertado etiquetas para identificar los turnos de habla, así como codificaciones en la línea %MOR (propiedades en las palabras como: número de sílabas del infinitivo; número de sílabas en la forma verbal; tiempo verbal; persona y número; tipo de conjugación; y características en estructuras complejas como: número de constituyentes; tipo de constituyentes/argumentos).

En su composición inicial, el corpus Koiné se había definido en un nivel de etiquetado básico que alcanzaba a la codificación de peculiaridades propias del habla infantil en cada componente (fónico, morfológico, sintáctico, léxico y pragmático), singularidades genuinas elementales como: concordancia, elipsis, formación de palabras, presentadores, construcciones idiosincráticas, bilingüismo. Se han marcado, en un primer nivel, todos aquellos casos que muestren particularidades con algún grado de sistematicidad y señalando el componente en que se inscriben. La etiqueta manejada es %par, seguida del indicador de componente $PRA, $PHON, $MOR, $SYN. En un segundo nivel de etiquetado se han especificado propiedades morfológicas y propiedades relacionales que avanzan niveles de progreso en diferentes vertientes. Con marcas de flexión verbal $VER, flexión nominal $NOM, formación de palabras $WFO. La faceta del desarrollo construccional se refleja en etiquetas como: $CON, construcción genuina (por su esquema, por los constituyentes, por su rección peculiar, por los argumentos); $AGR, concordancia; $PRES, referenciación y señalización; y $ELL, elipsis. Hay características comunicativas interesantes en contextos de convivencia de lenguas, como es la combinación de elementos mezclando códigos, lo que se subraya con la etiqueta $MIX indicadora de algún tipo de cóctel idiomático.

Descarga

Acceso a los archivos del inventario Koiné de habla infantil, codificado y etiquetado en CHILDES (es necesario instalar el sistema CLAN en el ordenador). El corpus (actualización de 2016) contiene etiquetas de propiedades comunicativas, fónicas y gramaticales. Descargar archivo zip [1,1 Mb].