Universidad Nebrija

revista.la@nebrija.es | ISSN 1699-6569 | Publicación semestral

El análisis factorial en la investigación aplicada a fenómenos lingüísticos
Factor Analysis in Applied Research on the Linguistic Phenomena
María Cecilia Ainciburu
Universidad de Siena (Italia) y Universidad Nebrija
ainciburu@unisi.it; caincibu@nebrija.es
RESUMEN

El objetivo de este trabajo es comentar el artículo de Mavrou (2015) y, en particular, sus afirmaciones acerca del Análisis Factorial. Dado que el suyo es un artículo de revisión de la investigación realizada por investigadores especializados, este comentario provee información agregada sobre su aplicación al campo disciplinar de esta revista.

Palabras clave: análisis factorial exploratorio, requisitos, uso en Lingüística Aplicada

ABSTRACT

The aim of this paper is to discuss the article Mavrou (2015) and, in particular, her statements about the Factor Analysis. Since it is a review article of the research conducted by specialized researchers, this comment provides added information on its application to the disciplinary field of this Journal.

Keywords: Exploratory Factor Analysis, Requirements, Use on Applied Linguistics

 

Fecha de recepción: 9/08/2015

Fecha de aceptación: 14/09/2015


Si bien los estudios factoriales nacen en el ámbito de la psicometría y asociados a la intención de medir capacidades psicoactitudinales, se han progresivamente difundido a otros campos de las ciencias sociales. La lingüística aplicada ha utilizado este método de análisis en muchos casos y con mayor frecuencia en el estudio de la evaluación de capacidades típicas de sus competencias.

Dado que el artículo realizado por Mavrou para este número de la Revista Nebrija de Lingüista Aplicada a la Enseñanza de Lenguas no tiene una intención didáctica, sino que constituye (como deseado) una revisión de diferentes autores, su redacción prevé una definición y ejemplificación introductoria muy breve. Cierto es que, en las investigaciones de los últimos años que aportan una enorme cantidad de datos, el análisis factorial permite una visión estilizada del fenómeno y brinda la posibilidad de confirmar a posteriori que el factor latente da cuentas del fenómeno estudiado y que la parte del efecto que este no explica es bastante contenida (no demasiado diferente al valor cero). Sería correcto decir, entonces, que el método de análisis multivariado está destinado a explicar las correlaciones entre un conjunto de p variables observadas a través de un conjunto de m variables no observadas.

En esta introducción, Mavrou hace una diferencia entre Análisis factorial (AF) y Análisis de las componentes principales (ACP), sin embargo, tal distinción tiene como riesgo que se la juzgue escolástica (Flick, 2013). En principio, el más prestigioso software estadístico para esta área de conocimiento, el SPSS, los trata como si del mismo test o familia de test se tratara. Es importante señalar que:

1. mientras el ACP es un método descriptivo que resume una matriz de datos en un número reducido de dimensiones, el AF se basa

en un modelo que requiere supuestos relacionados con consideración conjunta de las variables que intervienen. Sus inferencias acerca de la población implican ciertos conceptos como la bondad del ajuste y el significado precisión de las estimaciones que el ACP podría ignorar.

2. El ACP localiza una transformación particular de las variables observadas (una combinación lineal), mientras que en el la AF son las variables observadas las que se pueden expresar como una combinación lineal de factores latentes.

3. El PCA va a tratar de explicar con pocas componentes una gran parte de la varianza de las variables observadas, mientras que el AF considera la covarianza o las correlaciones entre variables.

Quedaría para discutir si el hecho de usar el programa más prestigioso en el ámbito de nuestra disciplina no constituye un límite a la posibilidad de realizar consideraciones de valor acerca de la diferencia entre los dos métodos de cálculo.

Desde el punto de vista de la revisión bibliográfica, el artículo de Mavrou (2015) afronta los siguientes temas:

la diferencia ya citada entre análisis factorial y de las componentes principales;
los estándares para la aplicación del procedimiento estadístico (tamaño de la muestra, ratio mínima por variable y ratio de variables por factor);
métodos de obtención de los factores;

  • la determinación del tipo de rotación a elegir;
  • la posibilidad de determinar a priori el número de los factores;
  • el significado de las cargas factoriales.

Todos los temas tienen un gran interés en el área de la lingüística aplicada y frecuentemente no se consideran en los artículos de investigación de revista, en los que efectivamente, es difícil y puede resultar poco interesante hacerlo, ni en las tesis doctorales. En esta última ocasión, en la que el espacio de redacción a disposición no está igualmente acotado, representa un límite en la descripción del procesamiento y posterior análisis de los datos. Por otra parte, el conocimiento de los textos de estadística y sus cuestiones técnicas, no solo está alejado de la sensibilidad de sus usuarios sino que, con gran frecuencia, está alejado del proceso mismo de formación de los estudiantes de posgrado.

Uno de los problemas centrales es que las observaciones experimentales contenidas en las tesis doctorales suelen contar con un número muy limitado de informantes. El error de cálculo, lo que Mavrou denomina “probabilidad de equivocación” es muy alto. Llama la atención que muchos autores se concentren en buscar otras investigaciones que hayan utilizado este tipo de análisis con un número mínimo de casos estudiados para avalar las propias decisiones. También llama la atención que no se llegue a decisiones acerca de un “número mágico”, para los casos como para las observaciones por variable o por factor. Cierto que la autora releva correctamente que estos datos no pueden “establecerse independientemente del grado de representatividad de los factores y el valor de las comunalidades” (Mavrou, 2015: apartado 3), pero es que es el concepto de representatividad de la muestra el que suele fallar en muchas investigaciones (Nesselroade y Cattell, 2013). Toda la estadística basada en la distribución normal requeriría una discusión cundo trabajamos con muestras “por conveniencia” o con “clases enteras” como sucede frecuentemente en los estudios que se desarrollan en ámbitos de aprendizaje institucional. Cuando aceptamos la falta inicial de aleatoriedad ¿hasta qué punto los pasos siguientes, por meditados que sean, dan confiabilidad a los resultados? Mavrou termina la sección 3 con una lista excelente de las cuestiones a considerar en relación con magnitudes y tamaños.

El parágrafo 3, centrado en la explicación de las bondades propias de los dos métodos de AF más utilizados, la Factorización de Ejes Principales (FEP) y el de Máxima verosimilitud (FMV), brinda buenos criterios para seleccionar uno u otro (ver también Cattell, 2012). En la mayor parte de las tesis doctorales de Lingüística Aplicada de los últimos años cuya investigación se basa en cuestionarios (actitudes, creencias, características sociolingüísticas) han utilizado el primer tipo, algunas veces utilizando constructos que se elicitan en baterías de cuestionarios utilizados previamente. Ninguna de las tesis parece discutir esta elección, a pesar de que alguna de ellas (especialmente las de evaluación y certificación lingüística) no suelen contar con un número de informantes mayor al de las variables de análisis.

Los siguientes parágrafos discuten la individuación o selección de factores, la rotación aplicada en los AF y la posibilidad de retener (en vez de eliminar) los factores que por sus características tienen poca informatividad en la estructura del fenómeno. El siguiente parágrafo, sobre la significación de las cargas factoriales liga el problema de la carga de un factor a las observaciones realizadas. Esta es seguramente una vía más segura de proceder que la adopción de un criterio fijo. El punto que debemos subrayar es que todos los razonamientos que realiza la investigadores se ligan a las premisas de numerosidad ya tratadas en los primeros apartados. Se recuerda así que “la aplicación del AFE requiere tamaños muestrales relativamente grandes” o que es necesaria “la identificación de un factor por medio de 3 variables”. Aquí ya hemos llegado a proporciones menos discutibles, Proporciones que, sin embargo, no suelen respetarse en las tesis. La complejidad de los fenómenos lingüísticos, de por sí, debiera requerir a gritos la estilización que proporcionan estos métodos de análisis. La lectura de tesis doctorales muestra que estos métodos de análisis se aplican con mayor facilidad en el campo del análisis de corpus automatizados, de evaluación certificadora y de análisis de test que se replican. Si los resultados de lectura de una muestra mínima tesis doctorales de un ámbito específico de la Lingüística aplicada se pudiera admitir como diagnostico general del área, es probable que debamos admitir alguna de estas dos explicaciones: (1) o solemos trabajar con grupos pequeños porque los trabajos de tesis son individuales o (2) no estamos informados de las posibilidades que ofrece este tipo de análisis. En las Conclusiones, Mavrou refuerza la segunda posibilidad aludiendo a la mayor facilidad de la replicación de los diseños metodológicos y que Fabrigar y otros (1999) evidencia como la tendencia a ‘hacer lo que hicieron otros investigadores’.

En la argumentación general de Mavrou echamos en falta el uso de bibliografía más actualizada y ejemplos de discusión-aplicación en Lingüística. Creemos que el debate generado por el área de evaluación y certificación, ligado a los buenos volúmenes de datos de análisis, deberían inspirar reflexiones más cercanas al área de interés de nuestros lectores.

En este comentario nos permitimos adjuntar otras características o elementos del AF que, por básicas que sean, no dejan de ser importantes y de faltar en algunas investigaciones de lingüística aplicada a la enseñanza de lenguas. Asociamos estas a las dadas por Mavrou (2015) en un intento de resumir el cuadro de “fundamentales”. Es posible que, como sucede en otros campos de la investigación cuantitativa, la facilidad de manejo de los programas y la superación de las necesidades de cálculo manual nos hayan acostumbrado a rodar los datos antes de prestar atención a los requisitos previos y a las posibles trampas de procesamiento (Jonassen y Grabowski, 2012). Por simplicidad y economía de esfuerzo, recurrimos a una herramienta pedagógica y elaboramos una tabla de control que mostramos a continuación, aplicable a los dos modelos de AF referidos en el artículo (FEP y FMV).



Elementos que caracterizan un AF


Elementos penalizan la significación del AF

Se ha diseñado el análisis factorial antes de la toma de datos


Se ha controlado la muestra

La muestra es demasiado pequeña como para obtener correlaciones estables


Se asimilan dos grupos de estructura factorial diferente en el mismo cálculo factorial

El análisis prevé una cantidad suficiente de factores de análisis

El diseño se simplifica al máximo para que las dimensiones sean pocas y fáciles de interpretar

Las variables tienen una buena distribución y formes de regresión apropiadas

Distribuciones muy asimétricas (en un test, ítems demasiado fáciles o demasiado difíciles)


Distribuciones truncadas


Distribuciones con casos extremos

Distribuciones bimodales


Regresiones no lineares


Hay muchas más variables que factores

El factor debe surgir de una o dos variables


Las variables son independientes

Dos variables tienen el mismo valor asociado a un ítem


Un ítem tiene una respuesta forzada (si se asigna un valor a un ítem, se debe asociar obligatoriamente un valor a otra variable)

Una variable es combinación final de las otras consideradas (por ejemplo en puntajes parciales y totales)


Las variables son puras o simples

Las variables deben implicar un solo factor y no medir más que uno.

Las variables son diferentes entre sí

Los constructos tienen variables muy similares, con baja jerarquía (dos ítems similares en su respuesta o prevén una respuesta alternativa)


Se elige la rotación adecuada

No hay rotación


El tipo de rotación es inadecuada


Se permite un grado de oblicuidad no justificado para obtener una estructura más simple

El primer factor extraído se considera factor general



Creemos que el esfuerzo de Mavrou (2015) es relevante para el área de investigación de esta revista. Sería necesario que las decisiones de análisis estadístico que tomamos para interpretar los datos empíricos de aprendizaje de lenguas extranjeras previeran la utilización de herramientas mayormente informativas. Es probable que los métodos de análisis tradicionales (el análisis de errores, entre otros) puedan afinarse en sentido cuantitativo para obtener datos mayormente informativos en un ámbito en el cual casi todos los estudios contrastivos de adquisición han podido acceder en los últimos años a mayores números de informantes, competencias y tareas realizadas.

 

Referencias bibliográficas

CATTELL, R. (Ed.). (2012). The scientific use of factor analysis in behavioral and life sciences. Springer Science & Business Media. (En Google books)

FLICK, U. (Ed.). (2013). The Sage handbook of qualitative data analysis. Sage.

HINKEL, E. (Ed.). (2011). Handbook of research in second language teaching and learning (Vol. 2). Routledge. (En Google books)

JONASSEN, D. H., & GRABOWSKI, B. L. (2012). Handbook of individual differences, learning, and instruction. Routledge.

NESSELROADE, J. R., & CATTELL, R. B. (Eds.). (2013). Handbook of multivariate experimental psychology. Springer Science & Business Media. (En Google books)


TESIS REVISADAS

AGUILERA, C. (2010). La identificación de los géneros discursivos en el sub-corpus de Química del Corpus Académico PUCV-2010: Hacia una propuesta metodológica integrada. Pontificia Universidad Católica de Valparaíso (Chile).

BARRACHINA MIR, S. (2008). Técnicas de agrupamiento bilingüe aplicadas a la inferencia de traductores. Universidad Jaume I de Castellón.

CHAMORRO DÍAZ, M. (2013). Sistema De Certificación de Lingua Galega (CELGA) no Marco Común Europeo de referencia para as linguas. Estudo de fiabilidade e validez. Universidad de Santiago de Compostela.

COBO DE GAMBIER, N. (2011). Creencias y actitudes sociolingüísticas en la clase universitaria de español como lengua extranjera en Alemania. Universidad Antonio de Nebrija.

DEL MORAL MANZANARES, F. (2015). El proceso de adopción de escalas de descriptores para la evaluación de la expresión e interacción orales en ELE y su influencia en la fiabilidad de la prueba. Universidad Antonio de Nebrija.

GÓMEZ, D. (2005). Transferencia entre modos del lenguaje y niveles de interacción: observar, señalar, escuchar, hablar, leer y escribir. Universidad de Guadalajara.

LLORENTE CEJUDO, Mª C. (2008). Blended learning: para el aprendizaje en nuevas tecnologías aplicadas a la educación: un estudio de caso. Universidad de Sevilla

MEIER, M. (2012). La enseñanza de la destreza oral y el uso de herramientas Web 2.0 en entornos virtuales (el español L2 en los EE.UU.). Universidad de Salamanca.

MINERA REYNA, L. (2009). Motivación y actitudes en el aprendizaje del español como lengua extranjera en Alemania. Universidad Antonio de Nebrija.

OLATZ LARREA, E. (2015). Estudio sobre la escucha de la voz del locutor con y sin su imagen. Universidad nacional de Córdoba (Argentina)

ZABALA DELGADO, J. (2014). Certificación de competencia lingüística en la universidad española: estudio de puesta en marcha. Universidad Politécnica de Valencia.