Revista Lingüistica> Revista 18 > Investigaciones en curso

Nº 18

La validación por juicio de expertos: dos investigaciones cualitativas en Lingüística aplicada

Validation by expert judgements: two cases of qualitative research in Applied Linguistics

Pilar Robles Garrote y Manuela del Carmen Rojas
Sapienza Università di Roma
pilar.robles@uniroma1.it , manueladelcarmen.rojas@uniroma1.it

RESUMEN

El objetivo de este artículo es discutir las implicaciones que surgen de la puesta en práctica de una validación basada en el juicio de expertos, proporcionando ejemplos de su implementación en investigaciones cualitativas en el ámbito de la Lingüística Aplicada a la enseñanza de lenguas. Se trata de dos experiencias de investigación desarrolladas en el contexto académico que, dadas sus características particulares, utilizan instrumentos de recogida de información distintos que han de ser validados de modo pertinente en cada caso. El objetivo de la primera de ellas es evaluar la expresión oral de estudiantes de L2 y debe validar los ítems y descriptores de un cuestionario destinado a este fin; el de la segunda, en cambio, es estudiar las estrategias pragmáticas en la interacción escrita de aprendientes plurilingües y debe validar la equivalencia de las consignas de producción de textos similares en diferentes lenguas. Tras la evaluación de los jueces, se concluye que, pese a que los mismos aportan nuevas perspectivas e interpretaciones útiles para la reformulación del instrumento de recogida de información, el carácter cualitativo de ambas investigaciones les otorga, en algunos casos, un alto grado de subjetividad a sus respuestas.

Palabras clave: metodología de investigación, validación, juicio de expertos, investigación cualitativa

ABSTRACT

The aim of this article is to discuss the implications which occurred as a result of an evaluation which was based on the input of expert judgment concerning examples of its implementation in qualitative investigations in the field of Applied Linguistics to language teaching. Two research directions were followed in an academic setting, each of which used different instruments due to the specific characteristics of each area of study. The aim of the first study is to evaluate students' oral expression in L2 and necessitated the evaluation of the items and descriptors of the questionnaire used for the study. While the second study examined the pragmatic strategies used for the written interaction of multilingual learners and had to evaluate the equivalence of the instructions to product similar texts in different languages. After the evaluations of the experts, it is concluded that although they bring new perspectives and useful interpretations for the reformulation of the instrument for collecting information, the qualitative character of both investigations grants them, in some cases, a high degree of subjectivity to their responses.

Keywords: research methodology, validation, expert judgment, qualitative research

Fecha de recepción: 30 enero de 2015

Fecha de aceptación: 14 febrero de 2015

1. introducción

El juicio de expertos es un método de validación útil para verificar la fiabilidad de una investigación que se define como “una opinión informada de personas con trayectoria en el tema, que son reconocidas por otros como expertos cualificados en éste, y que pueden dar información, evidencia, juicios y valoraciones” (Escobar-Pérez y Cuervo-Martínez, 2008:29).

Tras someter un instrumento de cotejo a la consulta y al juicio de expertos éste ha de reunir dos criterios de calidad: validez y fiabilidad. La validez de contenido se establece con frecuencia a partir de dos situaciones, una que atañe al diseño de una prueba y, la otra, a la validación de un instrumento sometido a procedimientos de traducción y estandarización para adaptarlo a significados culturales diferentes. Es aquí donde la tarea del experto se convierte en una labor fundamental para eliminar aspectos irrelevantes, incorporar los que son imprescindibles y/o modificar aquellos que lo requieran.

A fin de proporcionar un ejemplo de aplicación de este tipo de metodología, en este artículo presentamos dos casos de validación por juicio de expertos, denominados A y B, procedentes de dos investigaciones cualitativas en Lingüística Aplicada a la didáctica de las lenguas extranjeras.

Si bien ambas experiencias se desarrollan en el contexto de la enseñanza universitaria, abordan destrezas lingüísticas diferentes y poseen características propias que precisan de una validación pertinente en cada caso. La primera de las experiencias de validación tiene por objetivo la evaluación de la expresión oral de estudiantes de español L2 y debe validar los ítems y descriptores de un cuestionario destinado a este fin; la segunda, en cambio, estudia las estrategias pragmáticas en la interacción escrita de aprendientes plurilingües y debe validar la equivalencia de las consignas de producción de los textos que conforman el corpus objeto de análisis.

2. BREVE MARCO TEÓRICO

La evaluación mediante el juicio de expertos, método de validación cada vez más utilizado en la investigación, “consiste, básicamente, en solicitar a una serie de personas la demanda de un juicio hacia un objeto, un instrumento, un material de enseñanza, o su opinión respecto a un aspecto concreto” (Cabero y Llorente, 2013:14). Se trata de una técnica cuya realización adecuada desde un punto de vista metodológico constituye a veces el único indicador de validez de contenido del instrumento de recogida de datos o de información (Escobar Pérez, 2008); de ahí que resulte de gran utilidad en la valoración de aspectos de orden radicalmente cualitativo. Por ejemplo:

Al evaluar si los formularios de prueba son de dificultad similar, se pueden utilizar los juicios de expertos en un estudio para determinar la equivalencia en las áreas, complejidad del código, complejidad cognoscitiva y demanda comunicativa. Deberíamos tratar de proporcionar evidencias sobre la mayor cantidad de estos niveles que podamos (Weir, 2005:251).¹

Validez y fiabilidad son los dos criterios de calidad que debe reunir todo instrumento de medición tras ser sometido a la consulta y al juicio de expertos con el objeto de que los investigadores puedan utilizarlo en sus estudios.

La validez, definida como “el grado en que un instrumento de medida mide aquello que realmente pretende medir o sirve para el propósito para el que ha sido construido” (Martín Arribas, 2004:27), puede referirse al contenido o al constructo. En el primer caso, se señala que los ítems o aspectos elegidos para la elaboración del instrumento de medición son indicadores de lo que se pretende medir; la valoración de los expertos es cualitativa pues deben juzgar la capacidad del mismo para evaluar todas las dimensiones que deseamos medir. En cuanto a la validez de constructo, íntimamente relacionada con la anterior, indica que las medidas resultantes en el contenido pueden ser utilizadas y consideradas pertinentes al fenómeno que se quiere medir, para lo cual es fundamental previamente una clara definición del constructo o aspecto por medir.

La fiabilidad, el otro requisito de calidad de todo instrumento de medición, se define como el grado con el que un instrumento mide con precisión y descarta el error, y lo hace a través de la consistencia, la estabilidad temporal y el acuerdo entre los expertos. Martín Arribas (2004) define la consistencia como el nivel de cohesión de los diferentes ítems o aspectos del instrumento que se puede comprobar a través de diferentes métodos estadísticos como, por ejemplo, el coeficiente Alfa de Cronbach², utilizado con mayor frecuencia. En relación con la estabilidad temporal, alude a la escasa variabilidad de las medidas del objeto cuando el proceso de medición se repite en situaciones distintas. En otras palabras,

de la variabilidad de las puntuaciones obtenidas en repeticiones de la medición puede obtenerse un indicador de la fiabilidad, consistencia o precisión de las medidas. Si la variabilidad de las medidas del objeto es grande, se considerará que los valores son imprecisos y, en consecuencia, poco fiables (Prieto y Delgado, 2010:67).

Por lo que se refiere al grado de acuerdo entre los expertos, que se puede calcular utilizando el estadístico Kappa³, según Escobar Pérez (2008) es necesario no desestimar los elementos subjetivos que un juicio incluye; por tanto, si la medida de acuerdo es alta, habrá un mayor consenso en el proceso de valoración y, por consiguiente, una mayor posibilidad de réplica del instrumento de medición.

Para Cabero y Llorente (2013), el juicio de expertos como estrategia de evaluación presenta una serie de ventajas entre las que destacan la posibilidad de obtener una amplia y pormenorizada información sobre el objeto de estudio y la calidad de las respuestas por parte de los jueces. Según los autores, si se tiene en cuenta que “el concepto de experto es bastante polisémico”, su correcta aplicación depende de los criterios de selección y del número adecuado de los mismos. En cuanto a los procedimientos de elección de los expertos, los autores indican una diversidad que incluye desde los que no implican ningún filtro de selección, como en los casos de afinidad o cercanía entre el experto y el investigador, hasta los que utilizan una serie de criterios estructurados como son el Biograma o el Coeficiente de Competencia Experta.

En el primero de los dos criterios, el Biograma, se elabora una biografía del experto en función de sus respuestas sobre aspectos de su trayectoria como, por ejemplo, años de experiencia y formación, investigaciones o acciones formativas, conocimiento del objeto de estudio, a partir de los cuales se infiere su adecuación y pertinencia para su actividad de experto. Para la obtención del segundo, el Coeficiente de Competencia experta⁴, se parte de las personas que inicialmente se han considerado expertos para que con su opinión y autovaloración indiquen su nivel sobre el conocimiento acerca del objeto de investigación, así como de las fuentes que les permiten argumentar y justificar dicho nivel.

Por lo que atañe al número de expertos necesarios, no hay un acuerdo unánime para su determinación. En Cabero y Llorente (2013), la selección del número de expertos depende de aspectos como la facilidad para acceder a ellos o la posibilidad de conocer expertos suficientes sobre la temática objeto de la investigación. Por otra parte, autores como Escobar-Pérez y Cuervo-Martínez (2008:29) señalan que el número de jueces que se debe emplear en un juicio depende del nivel de experticia y de la diversidad del conocimiento.

En relación con los métodos de recogida de la información brindada por los jueces, las posibilidades son varias y, como en el caso de los procedimientos de selección de expertos, incluyen desde los más simples hasta los que implican un alto nivel de estructuración. Pueden realizarse de manera individual, grupal o a través del método Delphi⁵, técnica que ofrece un alto nivel de interacción entre los expertos. El método individual consiste en obtener información de cada uno de los expertos sin que los mismos estén en contacto. Entre las técnicas grupales se encuentra la nominal y la de consenso, en las que se requieren la presencia de expertos y un nivel de acuerdo, que es mayor en el caso de la segunda.

También son amplias las posibilidades en relación con los instrumentos de acopio de datos en las que se encuentran la recogida de información a través de cuestionarios, de entrevistas individuales, de grupos de discusión, de listas de características referidas al objeto, aspecto o fenómeno por evaluar. “La selección de uno u otro depende tanto del objeto a evaluar como de los objetivos que persiga el evaluador y la facilidad de acceso a los expertos” (Cabero y Llorente, 2013:18).

En la fase final del proceso de consulta a los expertos se elaboran las conclusiones del juicio que serán utilizadas para la descripción en términos de validez y fiabilidad del instrumento de medición, sin desestimar la presencia de variables individuales como la personalidad o las habilidades sociales de los jueces que pueden generar sesgos a favor de uno o varios aspectos del mismo (Escobar Pérez, 2008).

3. EXPERIENCIA A: VALIDACIÓN DE UN CUESTIONARIO DE EVALUACIÓN DE LA EXPOSICIÓN ORAL

3.1. CONTEXTO DEL PROCESO DE VALIDACIÓN

La experiencia de validación por expertos que se presenta a continuación se enmarca metodológicamente en una tesis doctoral cuya línea de investigación se centra en la fase de actuación de la exposición oral académica en clase y en su instancia de evaluación.

El objetivo general de la investigación es analizar los rasgos discursivos y lingüísticos predominantes en las exposiciones orales de los aprendientes de ELE y en comprobar cómo cambian en las sucesivas exposiciones, a través de un itinerario de aprendizaje, reflexión sobre las estrategias empleadas y adquisición de técnicas de expresión oral.

Se solicitó a los alumnos participantes que, después del visionado de las grabaciones del primer ciclo de exposiciones, comentaran y reflexionaran sobre los aspectos discursivos, lingüísticos y pragmáticos de las mismas. Y para evitar la focalización en el análisis de errores, se elaboró una parrilla de corrección –en forma consensuada- sobre las reflexiones y comentarios de la clase y los elementos teóricos proporcionados por el profesor. Dicha parrilla de corrección sirvió como base para la elaboración y negociación de los ítems de un cuestionario destinado a generar un baremo de calificación numérica de la exposición oral académica en clase. Para “legitimar” este baremo inducido, se solicitó a cuatro expertos la validación del mismo a los efectos de ser aplicado durante el segundo ciclo de exposiciones y considerado como una prueba final de cuya calificación numérica son responsables los mismos alumnos, junto a la evaluación personal del profesor.

En la tabla siguiente se resumen los aspectos de la investigación cualitativa que sirve de contexto al proceso de validación por expertos del cuestionario destinado a evaluar la exposición oral académica.

3.2. DESCRIPCIÓN DEL PROCESO DE VALIDACIÓN

Para la evaluación de la exposición oral académica, los alumnos participantes elaboraron un cuestionario (véase Anexo 1) inducido a los efectos de asignar una calificación numérica a cada una de las categorías para totalizar los 30 puntos del baremo. Se aplicó el juicio de expertos para que estos hicieran una valoración sobre los ítems que componen dicho cuestionario, así como una valoración global del mismo. En relación con los ítems, se les solicitó que valoraran cualitativamente su grado de pertinencia al objeto de estudio y, además, su grado de precisión y de adecuación desde el punto de vista de su definición y formulación sintáctica.

Se trata, pues, de una validación de contenido cuyos objetivos son analizar y valorar los descriptores del baremo inducido, así como comprobar si los ítems seleccionados miden todas las categorías o descriptores que se desea medir y que caracterizarán a la prueba de exposición oral académica.

Como criterio de selección, se optó por un grupo de cuatro expertos como fuente de información, cuya trayectoria se caracteriza por una larga experiencia en la enseñanza de ELE y en la investigación en Lingüística aplicada a la enseñanza. Como modalidad de evaluación se prefirió la individual, a través de un cuestionario escrito que cada uno de los jueces debía responder, sin mantener un contacto entre ellos.

El cuestionario destinado a ser sometido al juicio de expertos se elaboró a través de una serie de fases que se describen brevemente a continuación.

En la primera fase, se redactó una parrilla de forma consensuada, basada en los comentarios y reflexiones de la clase, y con elementos teóricos proporcionados por el profesor, a partir del visionado de las exposiciones orales de los alumnos participantes. Para evitar que dichos comentarios y reflexiones se focalizaran en el análisis de errores gramaticales y de pronunciación, se amplió el comentario sobre la exposición oral incluyendo, además de los aspectos lingüístico-discursivos, los paralingüísticos, los del lenguaje no verbal, y el empleo de apoyos técnicos.

La segunda fase estuvo dedicada a la negociación, elaboración y redacción del contenido del cuestionario, de sus categorías e ítems. Para ello se procedió, por parejas o en grupos de tres, inicialmente con discusiones y, posteriormente, contestando por escrito a cada categoría e ítem para motivar su calificación numérica sobre un total de 30 puntos. Esta negociación del baremo puede ser considerada un protocolo de enseñanza por cuanto forma parte del periodo de entrenamiento en técnicas de expresión oral.

En una tercera fase se validó el baremo inducido mediante el análisis y negociación de las calificaciones asignadas. La aplicación de este baremo durante el segundo ciclo de exposiciones puede considerarse una prueba final de cuya calificación numérica son responsables los mismos alumnos, junto a la evaluación del profesor.

En la fase final o de legitimación, la versión del cuestionario y baremo consensuados se sometió al juicio de cuatro expertos para obtener la convalidación de sus categorías y comprobar si las mismas se repiten, si faltan otras o si el peso de la evaluación está sesgado a favor de una de ellas.

En la tabla siguiente se indican brevemente los aspectos que se consideran esenciales en el proceso de validación del cuestionario.

3.3. DESCRIPCIÓN DEL CUESTIONARIO DE VALIDACIÓN PARA EL JUICIO DE EXPERTOS

Se estructuró el cuestionario en un total de 10 preguntas con un espacio en blanco para las observaciones en cada una de ellas.

En la primera pregunta se pide un juicio sobre el grado de relevancia de cada uno de los 6 descriptores o categorías.

Desde la pregunta 2 hasta la pregunta 7, se le pide al experto que valore el grado de relevancia de los ítems de cada categoría, invitándolo a añadir o suprimir alguno, o a modificar los ya existentes.

En la pregunta 8 se solicita al experto que califique cada uno de los descriptores según la claridad de sus ítems desde el punto de vista de su significado y de su formulación, efectuando las modificaciones que considere oportuno para garantizar la buena redacción y, por consiguiente, su brevedad y facilidad de comprensión.

En la pregunta 9 se le pide al experto que otorgue un valor numérico a cada descriptor o categoría para calificar la exposición oral con nota final de 30 (treinta) puntos. Y, por último, la pregunta 10, cuyo espacio en blanco está destinado para que el experto añada las categorías y la calificación numérica correspondiente que considere oportunas.

A continuación, se resume en una tabla el contenido y estructura del cuestionario por convalidar. El cuestionario consta de un total de 22 ítems, distribuidos en 9 preguntas.

3.4. OBSERVACIONES TRAS EL PROCESO DE VALIDACIÓN

Los jueces valoraron la construcción del cuestionario de acuerdo a su pertinencia o grado de relación entre los ítems y el constructo general “Evaluación de la exposición oral académica en ELE”; de acuerdo a la suficiencia, es decir, al número de ítems adecuado para la medición de cada una de las categorías por medir; de acuerdo a la ordenación de los ítems y al grado de dificultad para ser comprendidos por los individuos del estudio. Cabe señalar aquí que el proceso de elaboración del cuestionario (Véase 3.2.) por parte de los participantes, desde la fase inicial de reflexión y comentario de las exposiciones orales en clase hasta la fase final de valoración del baremo inducido, tuvo una duración semestral; y que la selección de los jueces y la valoración de dicho cuestionario por parte de estos últimos se llevó a cabo en dos meses.

Con los resultados se realizó un análisis cualitativo para evaluar la capacidad discriminativa de cada ítem a partir de las frecuencias observadas en cada una de las opciones de respuesta asignadas. De acuerdo con ello, se pudo inferir que, con respecto a la validez de contenido, las aportaciones cualitativas de los jueces consideraron apropiado el cuestionario al propósito para el que había sido construido. Concretamente, se obtuvieron valores superiores de acuerdo entre los expertos para evaluar la operatividad del constructo según los ítems destinados a medir sus dimensiones; solo en dos casos se sugirió en las observaciones la inclusión de un ítem nuevo (en el descriptor “Modalidad de exposición”) y la diferenciación gradual del ítem “Comunicación gestual” en el descriptor “Elementos no verbales”. Estas sugerencias se originaron a partir de una diferencia de perspectiva del constructo que lo alejaba del objetivo del mismo, desviando la atención del experto hacia un descriptor no pertinente en este caso. En relación con el descriptor “Claridad de formulación de los ítems”, dos de los cuatro jueces manifestaron no apreciar los límites entre dos de los ítems debido a la falta de claridad de sus respectivas formulaciones.

Por último, se observaron valores máximos de acuerdo entre los jueces para otorgar una calificación numérica alta a los “Aspectos discursivos” y “Aspectos lingüísticos”, mientras que para los otros descriptores, los valores de acuerdo entre los expertos fueron mínimos.

El cuestionario validado se consideró como un modelo para evaluar la “exposición oral académica”, una propuesta sobre los principales aspectos y criterios que deben ser objeto de análisis, susceptibles de ser ampliados y modificados mediante las sugerencias aportadas por los expertos. Los beneficios derivados de dichas sugerencias mejoran la validez del cuestionario pues inciden directamente en el contenido de los ítems y de algunos aspectos relacionados con su estructura, evitando posibles sesgos de contenido y/o errores durante su aplicación posterior.

4. EXPERIENCIA B: VALIDACIÓN DE CONSIGNAS PARA LA PRODUCCIÓN DE TEXTOS ESCRITOS

4.1. CONTEXTO DEL PROCESO DE VALIDACIÓN

La experiencia de validación que presentamos a continuación se encuadra en el marco metodológico de una tesis doctoral del área de la sociolingüística, centrada en el análisis de las estrategias pragmáticas de la interacción escrita de estudiantes plurilingües en L1 y L2.

La investigación tenía por objetivo analizar algunas estrategias pragmáticas de la interacción escrita (forma de tratamiento pronominal, cortesía verbal, tipo de petición y macroestructura) utilizadas por aprendientes italófonos en su L1 y en español e inglés L2 con el fin de verificar si coincidían con las de estudiantes nativos o si transferían las estrategias de su propia lengua.

Los informantes, estudiantes universitarios irlandeses, españoles e italianos, debían producir un texto escrito en L1 a partir de diversas situaciones comunicativas de petición en el ámbito académico en un género discursivo concreto: el correo electrónico. Para obtener los datos relativos a las estrategias pragmáticas en L2, los participantes italianos debían, además, generar una producción escrita de similares características en inglés y otra en español. De este modo, se crearían cinco corpus de correos electrónicos en cuanto a la lengua utilizada por los informantes: tres en L1 (español, italiano e inglés) y dos en L2 (español e inglés)

El hecho de que los estudiantes italófonos tuvieran que realizar la misma tarea en tres lenguas diferentes presentaba un inconveniente, pues podría inducir a los participantes a realizar una traducción literal del correo electrónico en los tres casos; así, para evitar sesgos se decidió proponer consignas con situaciones de petición diferentes para cada lengua, con un grado de imposición similar (alto en este caso) a fin de poder generar corpus comparables entre sí en cuanto al uso de las estrategias pragmáticas.

En la siguiente tabla presentamos un esquema descriptivo de la investigación cualitativa y los factores que inciden en la posterior selección del método de validación.

4.2. DESCRIPCIÓN DEL PROCESO DE VALIDACIÓN

Dado que los informantes italófonos habían de producir textos escritos análogos en tres lenguas, se les debía proporcionar tres consignas diferentes para su creación, sin embargo era necesario asegurar que éstas generasen corpus pragmáticamente comparables entre sí. Así, el objetivo de esta validación por juicio de expertos consistía en atestar que las consignas propuestas presentaban peticiones de similar grado de imposición que produjeran estrategias análogas y que fueran aplicables a diferentes niveles de competencia lingüística. Del mismo modo, se debía valorar si la traducción de las consignas mantenía una equivalencia en las tres lenguas y confirmar que no se produjesen variaciones pragmáticas que pudieran afectar al uso de las estrategias analizadas, asegurando así la fiabilidad de las mismas.

Para tener un margen algo más amplio en la selección final, se propusieron cinco consignas diferentes⁶, de las que, tras el proceso de validación, se seleccionarían tres que generarían los diferentes corpus de producciones escritas en cada caso. Todas ellas fueron traducidas por cada uno de los expertos en su lengua nativa, creando así una versión trilingüe de cada una de ellas.

La selección de los jueces expertos atendió al grado de experticia en la materia de investigación y al cumplimiento de ciertos requisitos específicos en cuanto a la nacionalidad, la lengua materna, el dominio de las lenguas analizadas, la especialización académica y la experiencia en enseñanza de L2 (español y/o inglés). Se contó con la colaboración de tres jueces, un experto nativo por cada una de las lenguas analizadas, todos ellos profesionales de la enseñanza de lenguas extranjeras (inglés y/o español) con conocimientos en las tres lenguas de las producciones escritas. Alguno de ellos contaba incluso con publicaciones sobre el tema.

Para el juicio de expertos se adoptó el método de evaluación individual, en el que cada experto debía responder a un cuestionario sobre algunas cuestiones acerca del instrumento de recogida de datos, en este caso las consignas, y proporcionar sus valoraciones de forma independiente sin contar con el resto de evaluadores. En otras palabras, los expertos no debían consensuar sus juicios, sino que la investigadora se encargó de tomar nota de las mismas y de las observaciones pertinentes para realizar las modificaciones oportunas.

A continuación resumimos brevemente los principales aspectos que se tuvieron en cuenta para determinar el proceso de validación del instrumento de recogida de datos empíricos.

4.3. DESCRIPCIÓN DEL CUESTIONARIO DE VALIDACIÓN PARA EL JUICIO DE EXPERTOS

Se creó un cuestionario de validación de 8 preguntas (véase Anexo 2) en el que se pidió la valoración de los expertos sobre los siguientes aspectos: la equivalencia pragmática de las versiones traducidas de cada consigna, la claridad en la formulación de las consignas, el grado de imposición de la petición descrita, los factores que afectan al grado de imposición, la adecuación de las consignas a los diferentes niveles de competencia lingüística (A2, B1, B2, C1 o C2), según el Marco Común Europeo de Referencia para las Lenguas (MCER), y la adecuación del vocabulario específico de cada nivel para realizar el producto textual indicado en la consigna. Para facilitar a los evaluadores un somero recordatorio de las exigencias específicas de cada nivel en la destreza analizada, se adjuntó la escala del MCER para la interacción escrita en general (Consejo de Europa, 2002:82).

En cuanto a la presentación de los ítems o preguntas para su evaluación, se efectuó de tres modos distintos. Por una parte, se expusieron diferentes afirmaciones que había que valorar en base a una escala de Lickert de 4 puntos en la que se debía expresar mayor o menor acuerdo y en cada pregunta se ofrecía una casilla de observaciones sobre la valoración. Por otra parte, se realizó una pregunta cerrada que proporcionaba dos opciones de respuesta, cuya selección debía realizarse de forma razonada en un espacio de respuesta abierta. Por último, se pidió una clasificación ordinal de los ítems en función de las preferencias del examinador, en la que se debía colocar en primer lugar la preferida y en el último la que se consideraba menos seleccionable; este tipo de pregunta también incluía una parte abierta en la que se debía justificar la respuesta.

4.4. OBSERVACIONES TRAS EL PROCESO DE VALIDACIÓN

Una vez finalizada la evaluación de los expertos, se tienen en cuenta sus aportaciones para realizar las modificaciones oportunas, ya que sus sugerencias avalan una concordancia entre el diseño del instrumento metodológico que se valida, su eficacia con respecto al objetivo para el que ha sido creado y el constructo. La duración del proceso de una validación por juicio de expertos es variable, pues depende, en primer lugar, de la disponibilidad de varios especialistas de la materia y, en segundo lugar, de las apreciaciones y aportaciones de los mismos, que incidirán directamente en el porcentaje de cambios en el objeto de validación.

En esta experiencia de investigación se solicitó la colaboración de los posibles candidatos adjuntando una invitación formal a participar como jueces validadores en la que se presentaba el proyecto de tesis, los objetivos de la investigación y el objetivo específico de la validación por juicio de experto. Hemos de señalar que se encontraron algunas limitaciones en la búsqueda de expertos que prolongaron la duración del proceso, puesto que la validación de la equivalencia pragmática de las consignas en tres lenguas, no solo exigía la colaboración de jueces con un perfil específico de formación y experiencia, sino que, además, sumaba la condición de ser hablantes nativos, uno de cada lengua, con conocimientos en las otras dos.

La validación de las consignas se desarrolló en varias secuencias de intercambio de impresiones entre la investigadora y los expertos; en algunos de los aspectos planteados las divergencias en las valoraciones de los jueces exigieron aclaraciones extras antes de proceder a la reformulación a partir de las observaciones recogidas. Esto ocurrió, por ejemplo, en la valoración sobre el grado de imposición de las peticiones especificadas en las consignas. Si bien las situaciones propuestas procedían de estudios que consideraban un alto grado de imposición en las peticiones, la percepción de los expertos no fue unánime en este sentido. Así, se llegó a la conclusión de que la percepción del grado de imposición dejaba un amplio espacio abierto a la subjetividad, regido por la diversidad de perspectivas, convenciones culturales y normas de formalidad en la tradición universitaria de los diferentes países (recordemos que se trataba de una petición a un profesor universitario).

En otros aspectos, como las traducciones de las consignas o la valoración de recursos lingüísticos y léxicos con respecto a los niveles de competencia más altos, hubo un porcentaje mayor de coincidencia en las valoraciones de los expertos.

Dado que el número de jueces era bajo, se valoró el grado de acuerdo entre ellos cotejando sus respuestas de modo contrastado. Tras la evaluación, se tuvieron en cuenta sus observaciones, se tomaron decisiones metodológicas y se realizaron modificaciones y reformulaciones para ajustar el contenido de las consignas que generarían los corpus de producciones escritas.

5. CONCLUSIONES

En el presente artículo hemos expuesto brevemente dos investigaciones cualitativas en Lingüística aplicada a la didáctica de las lenguas extranjeras. Ambas experiencias se desarrollan en el contexto de la enseñanza universitaria, sin embargo, abordan aspectos diferentes que han de ser validados de modo pertinente en cada caso.

Teniendo en cuenta el bajo número de expertos en las dos experiencias de validación, no se aplicaron una serie de procedimientos para su selección como, por ejemplo, el “coeficiente de Competencia experta” ni tampoco el estadístico Kappa para evaluar el grado de acuerdo entre los jueces.

Si bien los procesos de validación de las dos experiencias estaban dirigidas a evaluar instrumentos de recogida de información distintos (cuestionario de evaluación y consignas para la producción de textos), en ambas ha sido necesario reformular alguna de las preguntas para modificar la interpretación de la misma, ya que el modo de formulación de la pregunta incide en la respuesta; así una pregunta ambigua, poco clara o contextualmente confusa puede ocasionar una falsa percepción de lo que el investigador solicita validar.

No hay duda de que esta metodología de validación proporciona innumerables ventajas para evaluar y ajustar el instrumento de medición. Ahora bien, el carácter cualitativo de las experiencias de investigación que aquí presentamos hace que, en algunos casos, el factor ‘subjetividad’ incida en un alto grado en las respuestas de los jueces, puesto que sus diferentes perspectivas pueden hacer que estos últimos se desvíen del objetivo específico del constructo. Por este motivo, resulta imprescindible partir de una formulación clara de los objetivos a fin de que no se generen imprecisiones.

1. Cita original: “In evaluating whether test forms are equally difficult, expert judgements can be used in such a study to determine equivalence in the areas of code complexity, cognitive complexity, and communicative demand. We should try to provide evidence on as many of these levels as we practically can” (Weir, 2005:251).

2. El coeficiente Alfa de Cronbach es un indicador de la consistencia interna del instrumento de medición de la validación, ya que se calcula a partir de la covarianza entre los elementos analizados.

3. El estadístico kappa genera una medida de acuerdo entre los jueces. Tiene un rango que se ubica generalmente entre 0 (el valor del coeficiente de acuerdo es inferior al esperado por el azar) y 1 (indica un acuerdo perfecto entre los jueces).

4. Para la obtención del coeficiente de competencia experto se aplica la fórmula siguiente: K = ½ (Kc + Ka). Kc= el “coeficiente de conocimiento” o información del experto acerca del tema o aspecto estudiado; Ka= el “coeficiente de argumentación” o fundamentación del criterio del experto.

5. En el método Delphi cada juez realiza la evaluación individualmente y se recogen las opiniones de manera individual y anónima; luego de analizar las respuestas, se le envía a cada uno de ellos la mediana obtenida y se le pide que reconsidere su juicio hasta llegar a un consenso.

6. Las cinco consignas propuestas fueron adaptaciones o traducciones de situaciones de petición de alto grado de imposición analizadas en otros estudios empíricos.

Referencias bibliográficas

Cabero Almenara, J. y Llorente Cejudo, M. C. (2013), La aplicación del juicio de experto como técnica de evaluación de las tecnologías de la información (TIC). En Eduweb. Revista de Tecnología de Información y Comunicación en Educación, 7 (2) pp.11-22. Disponible en http://tecnologiaedu.us.es/tecnoedu/images/stories/jca107.pdf

Consejo de Europa. (2002). Marco común europeo de referencia para las lenguas: aprendizaje, enseñanza, evaluación. Madrid: Ministerio de Educación, Cultura y Deporte, Instituto Cervantes, Anaya, 2002. Disponible en http://cvc.cervantes.es/obref/marco

Durán Medina, J. F. (2011). La contribución del Edublog como estrategia didáctica. En Electronic Journal of Research in Educational Psycology, 9 (1), pp. 331-356. Disponible en http://www.investigacion-psicopedagogica.org/revista/new/ContadorArticulo.php?494

Escobar-Pérez, J. y Cuervo-Martínez, A. (2008). Validez de contenido y juicio de expertos: una aproximación a su utilización. En Avances en Medición, 6, pp. 27-36. Disponible en http://www.humanas.unal.edu.co/psicometria/files/7113/8574/5708/Articulo3_Juicio_de_expertos_27-36.pdf

Garrido Guzmán E. et al. (2010). Diseño y validación de un cuestionario para técnicos deportivos acerca de su opinión sobre las actitudes de padres y madres en el deporte (CTPDM). En Cuadernos de psicología del deporte, 10 (2), pp.7-21. Disponible en revistas.um.es/cpd/article/view/113001

Martín Arribas, M. C. (2004). Diseño y validación de cuestionarios. En Matronas Profesión, 5 (17), pp.23-29. Disponible en http://enferpro.com/documentos/validacion_cuestionarios.pdf

Prieto, G. y Delgado. A.R. (2010). Fiabilidad y validez. En Papeles del Psicólogo, 31 (1), pp. 67-74. Disponible en www.papelesdelpsicologo.es/vernumero.asp?id=1797

Weir, C.J. (2005). Language testing and validation. An Evidence-based Approach. New York. Palgrave McMillan.

ANEXO

ANEXO 1: Cuestionario para el juicio de expertos de la experiencia A

1. Valore en una escala de 1 a 4 el grado de relevancia que otorga a los siguientes descriptores y señale con una X su respuesta en la casilla correspondiente.

2. Valore en una escala de 1 a 4 el grado de relevancia que otorga a los ítems correspondientes a los aspectos discursivos. Señale con una cruz (X) su respuesta. Si considera necesario hacer alguna modificación o introducir otro(s) ítem(s), indíquelo en la casilla de observaciones.

3. Valore en una escala de 1 a 4 el grado de relevancia que otorga a los ítems correspondientes a los aspectos lingüísticos. Señale con una cruz (X) su respuesta. Si considera necesario hacer alguna modificación o introducir otro(s) ítem(s), indíquelo en la casilla de observaciones.

4. Valore en una escala de 1 a 4 el grado de relevancia que otorga a los ítems correspondientes a los componentes paralingüísticos. Señale con una cruz (X) su respuesta. Si considera necesario hacer alguna modificación o introducir otro(s) ítem(s), indíquelo en la casilla de observaciones.

5. Valore en una escala de 1 a 4 el grado de relevancia que otorga a los ítems correspondientes a los aspectos pragmáticos. Señale con una cruz (X) su respuesta. Si considera necesario hacer alguna modificación o introducir otro(s) ítem(s), indíquelo en la casilla de observaciones.

6. Valore en una escala de 1 a 4 el grado de relevancia que otorga a los ítems correspondientes a los elementos no verbales. Señale con una cruz (X) su respuesta. Si considera necesario hacer alguna modificación o introducir otro(s) ítem(s), indíquelo en la casilla de observaciones.

7. Valore en una escala de 1 a 4 el grado de relevancia que otorga a los ítems correspondientes a la modalidad de exposición. Señale con una cruz (X) su respuesta. Si considera necesario hacer alguna modificación o introducir otro(s) ítem(s), indíquelo en la casilla de observaciones.

8. Califique cada uno de los descriptores según la claridad de sus ítems desde el punto de vista de su significado y de su formulación. Señale con una cruz (X) su respuesta. Si considera necesario hacer alguna modificación, indíquelo en la casilla de observaciones.

9. Suponga que debe evaluar con nota final de 30 (treinta) la exposición oral, ¿qué valor le otorgaría a cada descriptor? Indique la nota en la casilla correspondiente.

10. ¿Hay alguna(s) categoría(s) que considera importante(s) y le gustaría añadir? ¿Y qué valor numérico sobre la nota final de 30 (treinta) le(s) otorgaría? Indíquelo en el recuadro.

ANEXO 2: Cuestionario para el juicio de expertos de la experiencia B

Lea atentamente las consignas (A, B, C, D, E) que proponen situaciones comunicativas para la producción de peticiones en la interacción escrita. Todas ellas reproducen peticiones del ámbito académico universitario con el mismo tipo de relación con el interlocutor y distancia social.

1. Compare las consignas en las tres versiones (inglés, italiano y español) para comprobar si son equivalentes entre sí y asegurar que no se producen variaciones pragmáticas en las diferentes lenguas que puedan afectar al uso de las estrategias analizadas. A continuación valore en una escala del 1 al 4 la siguiente afirmación: Las versiones de la consigna en español, italiano e inglés son equivalentes. (Señale su respuesta con una X en la casilla correspondiente)

2. Valore en una escala del 1 al 4 la siguiente afirmación: La consigna establece con claridad la situación que genera el producto textual. (Señale su respuesta con una X en la casilla correspondiente)

3. Indique cuál es el objeto de petición en cada una de las situaciones, señale si el grado de imposición para el destinatario de la petición es alto o bajo y comente las razones de su valoración.

4. A continuación le presentamos seis posibles justificaciones de los alumnos para las peticiones de las consignas A, B, C y D. Valore en una escala del 1 al 4 la siguiente afirmación: La justificación del alumno disminuye el grado de imposición de la petición (Señale su respuesta con una X en la casilla correspondiente)

5. Las consignas propuestas se presentarán en la L1 de los informantes y servirán para realizar producciones escritas de diferentes niveles de competencia lingüística del Marco Común Europeo de Referencia para las lenguas MCER (A2, B1, B2, C1 y C2). El (Consejo de Europa, 2002:82) presenta los siguientes descriptores para las actividades de interacción escrita en general en los diferentes niveles de dominio de la lengua:

Valore la siguiente afirmación en una escala del 1 al 4 introduciendo el número correspondiente a su valoración en la casilla de cada nivel: Los recursos lingüísticos del nivel (A2, B1, B2, C1 o C2) permiten generar la petición indicada en la consigna (No importa que el texto sea más o menos elaborado, sino que un alumno de ese nivel sea capaz de hacer una petición en esa situación).

6. Valore la siguiente afirmación en una escala del 1 al 4 introduciendo el número correspondiente a su valoración en la casilla de cada nivel: El vocabulario específico del nivel (A2, B1, B2, C1 o C2) permite realizar el producto textual que marca la consigna.

7. Ordene las consignas A, B, C, D y E según sus preferencias y explique brevemente las razones por las que la 1ª es su preferida y la 5ª es su última alternativa.

8. Observaciones adicionales: