La construcción del discurso académico en las lenguas extranjeras
En torno al estudio de frecuencia de uso de los grupos adverbiales
RESUMEN
Dentro de la Lingüística de Corpus Existen diversas líneas de investigación que abordan la descripción de textos de un determinado género a partir de un conjunto de rasgos lingüísticos. Es posible que estos estudios realizados sobre corpus nativos, dado que solo describen aspectos lingüísticos a nivel de la palabra, no logren dar una descripción integral de los corpus. Sin embargo, el estudio de la frecuencia de uso de los mismos rasgos en corpus no nativos tiene un potencial descriptivo y consecuencias didácticas diferentes. Este comentario busca abrir el trabajo de Genís y Orduna a la réplica sistemática y al seguimiento por medio de líneas de investigación complementarias que den una base empírica al conocimiento de la interlengua en la comunicación académica.
Palabras clave: rasgos lingüísticos, comunicación académica, estudios de corpus
ABSTRACT
In Corpus Linguistics several lines of research address the description of a certain genre texts from a set of linguistic features. Since only describe linguistic word level, these studies on native production can fail to give a comprehensive description of the corpus. However, the study of the frequency of use of the same features in nonnative corpus has a potential descriptive power and instructional consequences. This commentary invites to open Genís & Orduna research to systematic replication and complementary research to give an empirical basis at interlanguage knowledge in academic communication.
Keywords: linguistic features, academic communication, corpus studies
El trabajo de Genís y Orduna que se publica en este número de la Revista Nebrija, realiza un análisis cuantitativo o de frecuencia de uso de los grupos adverbiales en el inglés académico de alumnos universitarios españoles. Para eso, compara dos corpus de escritos de autores expertos y no expertos de diferentes áreas asimilables al campo de estudio de la Comunicación y nos ofrece resultados en términos de la función de dichos grupos, esto es, como enumeración, concesión, recapitulación, adición, transición, aposición, contraste, secuencia y resultado.
La investigación secundaria de la que parte el artículo se concentra sobre el objetivo último de estudio, los grupos adverbiales, y sobre la metodología básica empleada, esto es, el enfoque propio de la lingüística de corpus.
Puede resultar ocioso destacar la importancia del punto de análisis escogido por las autoras: en la construcción del discurso académico es fundamental el conocimiento y el uso de grupos léxicos que marquen claramente relación lógica entre las frases y construyan el eje narrativo y argumentativo. Las autoras no buscan deslindar conceptualmente el concepto de "conector" (que incluiría también adverbios, preposiciones y conjunciones), sino que se centran en el uso de un grupo particular y analizan cuantitativamente su utilización teniendo en cuenta la taxonomía de Biber y otros (1999).
Estas listas ha sido propuestas para otras lenguas y podrían observarse también -en algunos casos- en su forma constrastiva, sobre todo cuando las formas léxicas son cognadas o cuasi-cognadas respecto a la lengua materna o a otras lenguas segundas. Hablaremos de esto en un segundo momento, como aplicación posible de la lingüística computacional al corpus del artículo de referencia.
Los resultados del estudio, para un total de palabras comparable, ofrecen una visión en un primer momento algo desconcertante. Resulta que los estudiantes utilizan un número aproximadamente doble de grupos léxicos respecto al que usan los profesionales. Las autoras hipotizan que la extensión de los textos que componen cada corpus, mayor en los profesionales que en los escolásticos, podría explicar el fenómeno. La variabilidad resulta, sin embargo, muy marcada y sería interesante añadir -en un segundo momento- algún tipo de comparación de proporciones que permitiera dar algún apoyo a esta hipótesis o llevara a pensar que se trata de una inducción de tipo pedagógico. Esta segunda explicación podría tener una enorme importancia en la elaboración de itinerarios formativos dado que los manuales de lengua de niveles generales -sobre todo en los niveles B2 y C1- y los específicos para comunicación académica (ya citados con explicitud en el artículo de Llorián) dedican un número abundante de tiempo se enseñanza al uso de los conectores.
El uso de cada grupo específico estudiado está correctamente presentado por medio de porcentajes dado que se trata de un estudio piloto con un número total de palabras similar en los dos corpus. En un segundo estudio se podrían presentar datos de media y desviación estándar que permitan visualizar mejor la índole del fenómeno y visualizar si existen datos extremos en la producción de alguno de los escritores que pueden falsear la lectura del porcentaje total. Salvo en unos pocos casos, la diferencia de uso por funciones no parece mayor y podría estar asociada a la función general de los textos (informar, persuadir, argumentar) que no conocemos. En lo que el análisis profundiza, constituyendo el aspecto más destacable, es en la distribución de ocurrencias de cada uno de los grupos léxicos marcados. El análisis cuantitativo es de gran importancia aquí y habla por si mismo. En general existe una opción más representativa de la función (also para la adición o for examplepara la aposición) que usan tanto los profesionales como los estudiantes, mientras que la variación más evidente está en las alternativas menos arquetípicas. Los profesionales parecen tener a disposición un número mayor de graduaciones de cada función, como correspondería a grupos nativos o quasi nativos[1] y a un cierto tipo de escritos profesionales que rehuyen de la repetición. En contados casos, como ya se observó, el grupo léxico elegido por los profesionales difiere del del alumnado, es el caso de la selección del grupo léxico que indica la transición (meanwille/now) que parece necesitar otro análisis en un corpus con mayor número de ocurrencias.
Los dos grupos de resultados hasta aquí analizados, los que pertenecen a la presentación general de las funciones de los grupos léxicos interactivos y la específica ocurrencia de estos prefabricados dentro de la misma categoría funcional, constituyen un excelente primer apoyo empírico a una necesidad muy advertida por los docentes: la necesidad de aumentar el patrimonio léxico en un ámbito, la comunicación académica, que requiere un gran número de matices de significado y de recursos sinonímicos.
Las autoras prometen un segundo estudio que tenga en cuenta las áreas temáticas de producción escrita. Tal estudio sería de enorme interés, dado que -tratándose de estructuras o prefabricados léxicos- es probable que la índole general del campo semántico influya en la selección de los grupos léxicos utilizados, sea en su función sea en el grupo mismo que se escoge. En este segundo estudio sería interesante también que se hiciera referencia al nivel general de competencia de los estudiantes en la L2 según el Marco de referencia europeo para las lenguas.
Existen otros dos tipos de análisis que podrían realizarse en base al marcaje ya realizado en los dos corpus. Es perfectamente comprensible que las autoras no los hayan sugerido, dado que un artículo requiere una notable capacidad de síntesis, pero ambos contituyen un corolario natural del enorme trabajo que supone el tratamiento de un corpus previo a su análisis.
Por un lado, sugerimos un análisis de estos rasgos combinados con otros "coocurrentes" desde una perspectiva similar a la realizada por otros autores para el inglés (Biber 1988; McNamara, Lowerse y Graesser, 2004; Lowerse y otros, 2004) y por la escuela de Valparaíso para el español académico (ver sección Al día). En el primer caso se podrían comparar las diferentes dimensiones textuales, aunque esto requiriera un procesamiento más intensivo de otros rasgos gramaticales y sintácticos. Este segundo marcaje podría realizarse en forma automatizada. Generalmente se consideran los rasgos gramaticales y sintácticos presentes en la figura 1, se note cómo un factor fundamental como los grupos grupos adverbiales interactivos no hallan ubicación completa en dicha tabla.
Figura 1. Las 65 marcas lingüísticas consideradas por Parodi (2010: 85) para el análisis del corpus
Por esa razón, ya sugería Sambaj (2007) la integración de varios componentes en una matriz de análisis textual, componentes entre los cuales ya se preveían los prefabricados léxicos:
El modelo multidimensional que describimos a continuación está compuesto por las siguientes dimensiones:
- La teoría de la valoración
- Los modos de organización del discurso
- El modelo de indexación de eventos
- Las dimensiones del Proyecto Fondecyt 1020786
- Secuencias léxicas o lexical bundles
- La distribución de categorías gramaticales y unidades de medición estadística generales. (Sambaj 2007:206)
En esta óptica y retomando el artículo de Genís y Orduna, es posible que la frecuencia de grupos adverbiales de enumeración, concesión, recapitulación, adición, transición, aposición, contraste, secuencia y resultado fuesen diferentes según la función de la secuencia textual, esto es si se trata de predominio de focos (1) contextual e interactivo, (2) narrativo, (3) compromiso, (4) modalizador o (5) informacional (Parodi 2010). Como ya vimos, las autoras intuyen que el contexto semántico puede incidir en la ocurrencia de las unidades léxicas meta y una matriz de análisis más completa podría dar mayor respaldo de significatividad al análisis y, en un segundo momento, a la utilización del corpus en sede didáctica.
Mientras existe un anális bastante consistente y con buenas posibilidades de integración en la producción nativa de lenguas con fines académicos o profesionales, la situación en las lenguas segundas es más segmentada y un análisis con corpus de producción académica se presenta por el momento como un horizonte lejano. La posibilidad de integración se señala entonces como una meta y resulta claro que todos los esfuerzos para ir canalizando las energías de investigación hacia ese objetivo resultan claramente meritorios.
Una segunda posibilidad de ampliar el análisis, aprovechando el corpus ya marcado, consiste en realizar una descripción contrastiva de las unidades en cuestión. Un trabajo más cualitativo permitiría observar en forma más extendida las ocasiones de uso en contexto -centrandonos en las palabras próximas para evidenciar diferentes usos semánticos, más alla del meramente funcional- y, cuando posible, su dimensión psicolinguistica, para observar si la selección de un determinado prefabricado puede explicarse con hipótesis de semplificación, hipercorrección, transferencia, etc como sugieren los análisis de errores más tradicionales.
Con la intención de ilustrar la segunda propuesta, se presentan dos pequeños ejemplos de listas de concordancia para tres unidades léxicas equivalentes, en inglés, francés y español.[2]
Se ve claramente que existen posiciones esperadas de la unidad léxica en cada una de las lenguas. Como inicio de frase en inglés, en posición tenaza dentro de una forma verbal compuesta en francés y en una posición más libre en español. Del mismo modo, existen contextos más pertinentes y -en algunos casos- el valor de los hechos relacionados no es solo secuencial sino de pertinacia, de acción repetitiva y a veces incluso con una connotación valorativa. Estas ocurrencias no están escogidas según los criterios necesarios para validar un análisis de corpus, son solo un ejemplo de cómo un análisis de uso de los grupos léxicos meta del artículo de Genís y Orduna podrían colocarse en una posición más cercana a una idea de "significado contextual" de las expresiones (Tognini Bonelli 2001: 157-179), donde la posición, los significados accesorios y la connotación adquieren un valor diferente y se completan en la dimensión multifuncional de un corpus.
Este valor contrastivo y de recurso didáctico del corpus se aleja del objetivo de estudio de las investigadoras, pero creemos que lo completa en su intención ultima de servir a las necesidades docentes. No es posible cerrar estas consideraciones sin solicitar mayores esfuerzos para la construcción de corpus multilingües comparables de producción oral y escrita propios de la comunicación académica, no solo en la versión nativa "modélica" sino extendiéndola a contextos no nativos.
Biber, D. (1988). Variation across speech and writing. Cambridge: Cambridge University Press.
Biber, D., Johansson, S., Leech, G., Conrad, S. y E. Finegan, (1999). Longman grammar of spoken and written English. London: Longman.
Genis Pedra, M. y E. Orduna Nocito (2012). Análisis de la frecuencia de uso de los grupos adverbiales interactivos en el inglés académico de los universistarios españoles y sus implicaciones pedagógicas. Revista Nebrija de Lingüística Aplicada 12 (número especial), 35-48.
Louwerse, M., McCArthy, P., McNamara, D. y A. Graesser (2004). Variation in language and cohesion across written and spoken registers [en línea]. Disponible en:
http://www.autotutor.org/publications/AddPaper/LouwerseMcCarthyMcNamaraGraesser2004.pdf
McNamara, D., Lowerse, M. y A. Graesser, A. (2004). Coh-metrics: Automated cohesion and coherence scores to predict text readability and facilitate comprehension [en línea].
Disponible en: http://cohmetrix.memphis.edu/cohmetrixpr/archive/Coh-metrixGrant.pdf
Parodi, G. (2010). Lingüística de corpus: De la teoría a la empiria. Frankfurt: Iberoamericana Vervuert.
Sabaj, O. (2007). Hacia una matriz de rasgos lingüísticos con impacto textual: Un estudio exploratorio. Rev. signos [online], vol.40, n.63 [citado 2012-08-29], pp. 197-218 . Disponible en:
http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342007000100010&lng=es&nrm=iso ISSN 0718-0934. doi: 10.4067/S0718-09342007000100010
Tognini-Bonelli, E. (2001). Corpus linguistics at work: Studies in corpus linguistics. Amsterdam: John Benjamins.
[1] No todos los autores son nativos, pero suponemos, por la índole de las publicaciones, que casi todos los trabajos se sometieron a la corrección de un editor o del equipo de redacción de la Revista en la que fueron publicados.
[2] Los ejemplos de concordancia del CREA y del CCE (Corpus Concordance English) no tienen una selección intencional ni propósitos de investigación por lo que han de considerarse solo como muestra metodológica y no por el valor de los resultados que pudieran elicitarse.