Seminarios de investigación para doctorandos en Lingüística Aplicada

SEMINARIO 4:
Curso de técnicas de investigación
Introducción a los corpus de aprendices de L2 y su uso en la investigación en Lingüística aplicada

  • Fecha: viernes, 11 de octubre de 15:00 a 18:00 y viernes, 18 de octubre de 11:00 a 14:00.
  • Modalidad: Virtual (campus virtual).
  • Duración: 10 horas (2h lecturas previas+ 6h lectivas + 2h de trabajo de aplicación).

Ponente

Cristóbal Lozano

Dr. Cristóbal Lozano

Profesor titular en la Universidad de Granada desde 2010, donde imparte clases de grado y posgrado sobre adquisición de segundas lenguas, bilingüismo, psicolingüística y corpus de aprendices. Es licenciado en filología inglesa (Universidad de Granada), máster de investigación en adquisición de español como L2 (University of Hertfordshire), y doctor en lingüística y adquisición de segundas lenguas (University of Essex). Ha publicado extensamente en revistas internacionales sobre estas líneas de investigación y ha trabajado en diversas universidades: Autónoma de Madrid (como investigador postdoctoral MEC y como investigador 'Juan de la Cierva'), Castilla-La Mancha (profesor ayudante doctor), y Pennsylvania State University (investigador 'Fulbright'). Cuenta con 3 sexenios de investigación. Actualmente investiga la adquisición y procesamiento de la anáfora (proyecto ANACOREX, PID2020-113818GB-I00). Es director del corpus CEDEL2 (http://cedel2.learnercorpora.com) y director y fundador del laboratorio de investigación BilinguaLab ‘Laboratorio de Bilingüismo, Adquisición y Procesamiento del Lenguaje’ (https://bilingualab.ugr.es). Ha publicado extensamente sobre adquisición del español y del inglés como segunda lengua, bilingüismo, psicolingüística y corpus de L2 en numerosas editoriales y revistas científicas de impacto. Más información sobre Cristóbal en su web académica: https://wpd.ugr.es/~cristoballozano


Contenidos del seminario

El auge de la investigación del español como segunda lengua (L2) en la última década, ha incentivado la creación de grades bases de datos lingüísticas (llamadas "corpus") que sirvan de fuente de datos para tal investigación. En este seminario, presentaré un breve panorama sobre el campo de los corpus de español como segunda lengua / lengua extranjera para posteriormente presentar el corpus CEDEL2 (Corpus Escrito del Español como L2), cuyos datos empezaron a recogerse en 2006. A fecha de hoy, en su segunda versión, CEDEL2 contiene más de 1.100.000 palabras procedentes de unos 4.400 hablantes. Los hablantes son de dos tipos: (1) aprendices de español como segunda lengua cuyas lenguas maternas son tipológicamente similares y diferentes (inglés, alemán, neerlandés, francés, portugués, italiano, griego, ruso, chino, japonés, árabe); (2) hablantes nativos de español de todas las variedades (español peninsular y español latinoamericano: argentino, mejicano, colombiano, etc.).

En la segunda parte, exploraremos la interfaz web de CEDEL2 y aprenderemos a hacer búsquedas y descargas con el objetivo de familiarizarnos con sus posibilidades para la investigación y la docencia de ELE/EL2. CEDEL2 puede ser un buen punto de partida para usarlo como fuente de datos en trabajos de investigación/tesinas/tesis.

Durante las dos sesiones se tratarán de manera detallada los siguientes aspectos:

  • Introducción a los corpus de aprendices de ELE/EL2 y su relación con la adquisición de segundas lenguas.
  • Diseño y estructura del corpus CEDEL2: retos y oportunidades.
  • La interfaz del corpus CEDEL2:
    • Exploración de la interfaz.
    • Búsquedas de concordancias.
    • Descargas de ficheros.
    • Consultas complejas de: palabras, elementos gramaticales (lemas, etiquetas morfosintácticas), estadística.
    • Se ilustrarán las consultas con fenómenos lingüísticos como la concordancia nombre-adjetivo, orden adjetivo-nombre, alternancia ser/estar, etc.

Objetivos:

Con este seminario se pretende que el alumno/investigador de ELE/EL2:

  • adquiera los conocimientos básicos sobre qué son los corpus de aprendices de segundas lenguas/lenguas extranjeras y qué usos tienen.
  • adquiera las habilidades técnicas para consultar (interrogar y descargar) el corpus electrónico de aprendices de español como ELE/EL2 denominado CEDEL2 (http://cedel2.learnercorpora.com).
  • aprenda a consultar y analizar en dicho corpus algunas de los problemas gramaticales típicos de los aprendices de ELE/EL2.

Metodología docente: Teórico-Práctica

Evaluación: Asistencia y aprovechamiento. Se controlará la asistencia síncrona y asíncrona y se realizará una tarea de evaluación compuesta de dos elementos:

  • PARTE 1: Participación en alguno de los corpus de BilinguaLab según el perfil del participante (como aprendiz de inglés L2 o como aprendiz de español L2) a través del enlace: http://learnercorpora.com De este modo, el alumno entenderá mejor algunas de las cuestiones que discutiremos en este seminario sobre el proceso de recogida de datos de corpus. Se premiará la participación del siguiente modo: (a) los participantes podrán ver el nivel de competencia que han conseguido en el test de nivel; (b) podrán recibir un certificado de participación por parte de BilinguaLab UGR; (c) podrán voluntariamente optar a la remuneración de 10€ por participar en los componentes escrito + oral del corpus (participando tanto como aprendices como nativos).
  • PARTE 2: Breve análisis de datos del corpus CEDEL2. Trabajo de investigación escrito (máximo 2 folios A4): Partiendo de búsquedas de concordancias del corpus CEDEL2 (http://cedel2.learnercorpora.com), analizar alguna estructura lingüística o léxica que haya sido previamente investigada en la adquisición del español como L2/LE – ver el libro de Geeslin 2014 o cualquier otra publicación o paper que investigue cualquier fenómeno lingüístico en español L2) p.ej.: orden de palabras, ser/estar, orden nombre/adjetivo, concordancia nombre-adjetivo, tiempo o aspecto verbal, sintaxis del verbo ‘gustar’, etc. Se espera que el alumno utilice las herramientas de búsqueda de CEDEL2 vistas en clase para tal fin. La idea es que el alumno se familiarice con la interfaz de búsqueda de CEDEL2 y, de camino, reflexione sobre posibles estructuras que puedan ser investigadas en el futuro en su trabajo de investigación. Este pequeño trabajo escrito se estructurará del siguiente modo (sugerencia):
    • Título.
    • Resumen breve.
    • Revisión del fenómeno investigado según la literatura de español L2 (revisar al menos algún estudio que haya investigado el fenómeno de interés).
    • Método (cómo se hicieron las búsquedas en CEDEL2 y qué muestra se analizó).
    • Resultados (concordancias + alguna tabla numérica o gráfica con los resultados).
    • Conclusión (qué nos dice el corpus CEDEL2 sobre el fenómeno investigado en relación a lo que otros investigadores han hallado).
    • Bibliografía.

Lecturas previas

  • Lozano, C. (2022). CEDEL2: Design, compilation and web interface of an online corpus for L2 Spanish acquisition research. Second Language Research, 38(4), 965-983. https://doi.org/10.1177/02676583211050522 [Acceso gratuito]

Bibliografía para profundizar

(a) ADQUISICIÓN DE ESPAÑOL L2:

  • Geeslin, K. L. (Ed.). (2014). The Handbook of Spanish Second Language Acquisition. Wiley-Blackwell. http://doi.org/10.1002/9781118584347

(b) CORPUS DE ESPAÑOL L2:

  • Lozano, C. (2020). How to do research in SLA by combining corpus and experimental methods: An introduction for language researchers and teachers. En M. Planelles Almeida, A. Foucart, & J. M. Liceras (Eds.), Perspectivas actuales en la enseñanza y el aprendizaje de lenguas en contextos multiculturales / Current Perspectives in Language Teaching and Learning in Multicultural Contexts (Vol. 4, pp. 389-421). Thomson Reuters Aranzadi. https://doi.org/10.32029/2605-4655.11.01.2020
  • Lozano, C. (2021). Corpus textuales de aprendices para investigar sobre la adquisición del español LE/L2. En M. Cruz Piñol (Ed.), E-Research y español LE/L2: Investigar en la era digital (pp. 138-163). Routledge. http://doi.org/10.4324/9780429433528-9
  • Lozano, C., & Fernández-Mira, P. (2022). Designing, compiling and interrogating corpora in L2 Spanish acquisition research. Journal of Spanish Language Teaching, 9(2), 190-206. https://doi.org/10.1080/23247797.2022.2157086
  • Rojo, G., Palacios, I., Sampedro Mella, M., & Marsily, A. (2022). Los corpus de aprendices de español LE/L2: Panorama actual y perspectivas futuras. Journal of Spanish Language Teaching, 9(2), 174-189. https://doi.org/10.1080/23247797.2022.2157085