Marta Baralo Ottonello

La investigación en español como lengua segunda: necesidad de un corpus de español no nativoMarta Baralo Ottonello
Universidad Antonio de Nebrija (España)

1. Introducción

Este V Congreso Internacional de la Lengua Española (CILE) constituye una oportunidad excepcional para reflexionar sobre el estado de la formación en la enseñanza del español como lengua extranjera (ELE) y de la investigación en esta área. Es un espacio oportuno para divulgar el desarrollo del español como lengua extranjera, ya que los 25 años aproximados de su vida profesional e institucional en España y en América han permitido desarrollar, implantar y afianzar el español como lengua extranjera (ELE) en el ámbito académico y en el profesional durante este periodo. El desafío principal en este momento es conseguir un mayor desarrollo de la investigación, tanto en la lingüística descriptiva como en la lingüística teórica y la lingüística aplicada a ELE.

La enseñanza del español como lengua segunda o extranjera y la formación de profesores de ELE se ha visto impulsada en las dos últimas décadas por múltiples acciones institucionales, por el desarrollo de la lingüística aplicada a la enseñanza de ELE en la comunidad docente, por la apuesta de numerosas universidades públicas y privadas de España y del mundo, por los programas formativos del Instituto Cervantes, por la organización de Congresos y la publicación de revistas especializadas. Y muy particularmente por la necesidad creciente de profesores formados profesionalmente para responder a las demandas constantes de aprender español en los más diversos lugares y con los más diversos fines.

El espacio del ELE está ya organizado por áreas interdisciplinares que tienen gran interés para la investigación y para la formación integral del profesor, que podríamos reunir en torno a la lingüística descriptiva en sus diferentes niveles de análisis, la psicolingüística, la sociolingüística, la pragmática, la antropología lingüística, el análisis del discurso, la didáctica, la investigación-acción en el aula, la evaluación y certificación lingüísticas, las tecnologías del habla, el aprendizaje autónomo y las plataformas virtuales. Cada una de estas áreas puede trabajar en interfaz con algunas de las otras, por lo que se han abierto líneas específicas de investigación básica y aplicada en ELE, que empiezan a generar publicaciones y congresos con impacto en la comunidad científica internacional.

Como decíamos en el Simposio «25 años de ELE», organizado por el Instituto Cervantes,1 la actividad académica de ELE ha empezado a interrelacionarse con sectores profesionales diferentes, que permiten construir proyectos multidisciplinares muy fecundos. Ingenieros informáticos, psicólogos, antropólogos, diseñadores, mediadores interculturales, expertos en bellas artes, en comunicación, economistas, sociólogos, editores, junto a lingüistas, filólogos y pedagogos constituimos equipos de trabajo innovadores en el mundo de ELE. La existencia de redes sociales y profesionales para los profesores de ELE, de las que FORMESPA, patrocinada por el Ministerio de Educación español, es una buena muestra, junto con redes muy extendidas como ELEBRASIL y muchas otras que agrupan a socios y usuarios de diferentes países, facilita las relaciones profesionales en torno a la enseñanza de ELE. Estas redes permiten compartir información, actividades didácticas, bibliografías, textos académicos y científicos, recursos, apoyos y todo tipo de ayudas para formarse y crecer como profesor de ELE.

2. La investigación en español como lengua segunda

En el ámbito de la investigación en ELE hemos avanzado menos que en el ámbito de la formación de profesores y en el de la creación y edición de materiales didácticos para su enseñanza. Desde los años 80 se ha ido desarrollando un movimiento creciente de comunicaciones en congresos y publicaciones en revistas; algunos de estos trabajos son productos de una investigación sólida y replicable, aunque en la mayoría de los casos se trata de trabajos de segunda fuente, de revisiones con carácter divulgativo y de experiencias didácticas, de gran calidad, resultado de la aplicación de metodologías activas y comunicativas.

Existen algunos grupos de investigación vinculados a departamentos universitarios, que tienen programas específicos de lingüística aplicada y que ya han generado un buen número de tesis doctorales que investigan algún aspecto del aprendizaje y la enseñanza de ELE.2 Los estudios en el marco del Análisis de Errores y Análisis de la Interlengua han permitido conocer mejor las dificultades de adquisición y la persistencia de ciertos errores de español en hablantes de diferentes lenguas maternas.

Las investigaciones actuales que se están realizando en el ámbito de la gramática pedagógica recurren a las metodologías de análisis contrastivo entre el español, lengua meta, y la lengua materna del que aprende. En el marco de la psicolingüística, la sociolingüística, la pragmática, el análisis del discurso, se están planteando hipótesis y preguntas relacionadas con diferentes problemas del aprendizaje de ELE, se están realizando estudios experimentales en los que se investiga el valor de determinadas variables en el proceso de aprendizaje de ELE (edad; nivel de dominio; papel de la lengua materna —lenguas próximas, lenguas tipológicamente alejadas—; enseñanza de lengua frente a enseñanza de contenidos; dimensión afectiva —actitudes, creencias, distancias, preservación, aculturación, asimilación—; variables curriculares para la población migrante, entre muchos otros temas).

Aprovechando el marco internacional de este V CILE, conviene llamar la atención sobre la necesidad de que todo el conocimiento nuevo, resultado de la investigación en ELE, se difunda en español, en revistas registradas y reconocidas por la comunidad científica internacional y las agencias evaluadoras de la investigación. La lingüística aplicada puede echar luces esclarecedoras sobre qué enseñar, por qué y para qué, cuestiones básicas para cualquier diseño curricular. Todavía no existe ningún modelo teórico que pueda explicar todos los aspectos que se integran en el concepto de interlengua. Cada teoría se plantea un ámbito de investigación, con unas preguntas diferentes, con objetivos y metodologías de investigación diferentes y, por consiguiente, con respuestas diferentes, difícilmente comparables. Estos modelos tienen ventajas e inconvenientes según la perspectiva con la que se analice, sea la del lingüista, la del psicólogo, la del sociólogo o la del profesor. Y las investigaciones dentro de cada uno de estos modelos generan resultados diferentes, según los datos en los que se hayan basado para la descripción y para el análisis de las producciones en español de los hablantes no nativos. Las excelentes tesis doctorales que se han publicado son estudios parciales, como es lógico, y difícilmente pueden compararse entre ellas, porque no comparten requisitos básicos de la investigación como los criterios y las maneras de elicitación de datos así como su procesamiento. Podemos contar también con publicaciones periódicas especializadas, que difunden trabajos de investigación serios, sujetos a juicio de expertos en el tema, que cumplen con los requisitos de la comunidad científica internacional.3 En ellas se reflejan las líneas de investigación predominantes que señalábamos arriba, pero es justamente en estos trabajos donde los estudiosos echan en falta la existencia de bases de datos fiables que puedan contrastarse, que permitan replicar los estudios, las hipótesis y confirmar las conclusiones.

Existe un campo de investigación en ELE que requiere desarrollar un verdadero proyecto de investigación aplicada. Se trata de los diseños de tareas, pruebas y exámenes para la Certificación lingüística, atendiendo a los parámetros del Marco europeo de referencia. Todavía no contamos con secciones de investigación empírica para la elaboración de ítems capaces de medir y certificar los niveles de dominio de las actividades de la lengua y de la competencia lingüística comunicativa: pruebas de nivel y de clasificación que no confundan la competencia comunicativa con la competencia gramatical y léxica; bancos de ítems con fiabilidad y validez comprobadas empíricamente; pruebas que enfoquen más hacia la competencia pragmática que hacia la corrección gramatical, que atiendan a la asimetría en los niveles de dominio de las diferentes capacidades y habilidades en las actividades de la lengua, orales y escritas, interpretativas y expresivas.

Otra línea de investigación en la enseñanza de ELE pretende conseguir la integración de los recursos didácticos digitales y la redefinición de los papeles que pueden desempeñar este tipo de recursos y los sistemas de comunicación telemáticos en la actividad docente. En la actualidad hay proyectos que persiguen el diseño de programas de aprendizaje de lenguas a través de contenidos significativos para el que aprende y que combina la tecnología con diferentes formas de organizar el aprendizaje, especialmente el aprendizaje intensivo más que el lento goteo de clases semanales. Una buena muestra de esta línea de trabajo para ELE, muy poco implantada todavía, es TICCAL,4 destinada al aprendizaje del español como lengua vehicular en la enseñanza de disciplinas no lingüísticas. Este tipo de iniciativas deberían fomentar la cooperación entre instituciones de formación del profesorado y centros de enseñanza de ELE, en el área de AICLE (aprendizaje integrado de contenidos y lenguas extranjeras), de manera que se pudiera compartir una plataforma virtual en Internet sobre la enseñanza de ELE en Europa y en el resto del mundo, que constituya un foro de discusión para el profesorado sobre los diferentes modelos de aprendizaje lingüístico, un banco de datos que reúna publicaciones especializadas sobre AICLE, un banco de materiales didácticos para la enseñanza de español por contenidos, así como un foro de alumnos para fomentar proyectos comunes sobre los temas de los materiales didácticos. Este desafío exige una mayor profesionalización de los profesores que les permita ser usuarios competentes de los recursos tecnológicos, participar en acciones coordinadas, gestionar experiencia compartida y favorecer el progreso hacia la estandarización de los modelos curriculares.

Por otra parte, las investigaciones aplicadas al desarrollo de Objetos digitales de aprendizaje (ODA ), que estén etiquetados según estándares generales y compartidos, para ser utilizados en plataformas variadas, que posean un índice alto de granularidad y que resulten accesibles para las personas con ciertas discapacidades se encuentran todavía en fase inicial, con desarrollo de prototipos, pero con muy buenas posibilidades de implantación.

El avance en la investigación en ELE se vería enriquecida y facilitada si se consiguiera crear una gran plataforma que acoja, en una biblioteca global, toda la investigación publicada sobre ELE, ya que la dificultad que existe todavía para conocer lo que se está haciendo en diferentes universidades del mundo resulta costosa. La aportación de RedELE y del Centro Virtual Cervantes es grande, pero el reto es ampliar la Biblioteca Global de ELE hasta un alcance en el que se incluyan toda la producción de ELE de todas las universidades del mundo.

3. Los corpus de español no nativo y la investigación aplicada

A medida que se amplía y se intensifica la investigación en todos los aspectos de la enseñanza y el aprendizaje de ELE, surgen preguntas de investigación que requieren descripción y análisis a partir de datos fiables: ¿Qué tipos de errores son más frecuentes? ¿En qué nivel de dominio de la lengua meta se encuentran? ¿Son errores de desarrollo? ¿Por qué existen ciertas estructuras fonológicas, morfológicas, sintácticas, léxicas, pragmáticas que se fosilizan? Estos procesos de fosilización, ¿son iguales en todos los que aprenden español o son diferentes según la lengua materna del que aprende? ¿En qué medida influye y de qué modo la lengua materna?, ¿en los errores?, ¿en el tiempo necesario para alcanzar determinado nivel de dominio en ELE?, ¿en el tipo de estructuras que deben trabajarse durante más tiempo?, ¿en la formación de nuevos hábitos lingüísticos? ¿Son iguales de válidos todos los métodos de enseñanza de ELE para todos los aprendientes, o varía su eficacia según otras variables relacionadas con las estrategias de aprendizaje y de comunicación, con las tradiciones culturales de cada comunidad idiomática? ¿Es universalmente válida la corrección de errores? ¿Influyen otros factores en la eficacia de diferentes formas de reparar el error? Si existen esos otros factores, ¿cuáles son los más eficaces para cada tipo de alumno o para cada contexto de aprendizaje de ELE? Ninguna de estas preguntas ni otras muchas que podríamos seguir formulando sobre la enseñanza de ELE puede ser contestada de forma científica si no se cuenta con una base de datos de interlengua española fiable, contrastable, comparable, que reúna los requisitos impuestos por el imprescindible control de variables que subyacen a la comparación. Por esta razón queremos aprovechar el contexto panhispánico de este Congreso para llamar la atención sobre la imperiosa necesidad de aunar esfuerzos para la construcción de un gran corpus de español no nativo.

Penadés (2005) pone de relieve con toda claridad, como tantos otros investigadores, que para que el conocimiento sea científico debe derivarse no sólo de la experiencia del profesor/investigador —si acaso ésta debe ser el punto de partida—, sino del análisis de los datos existentes en materiales reales producidos por estudiantes de ELE. Pero para llevar a cabo estudios de ese tipo necesitamos disponer de corpus que recojan muestras orales y escritas de las producciones de los estudiantes de español. Y ahí nos encontramos con una seria dificultad metodológica, ya que no existe en la actualidad para el español no nativo ningún corpus extenso, de grandes dimensiones, y de fácil acceso para que los investigadores puedan llevar a cabo investigaciones sobre análisis de errores lingüísticos, sobre problemas de adquisición relacionados con la lengua materna, con el nivel de conocimientos, con el sexo o la edad de los estudiantes, sobre tipos, frecuencias, condicionamientos e implicaciones de las transferencias lingüísticas, sobre elaboración de materiales didácticos, entre otros tantos temas de estudio que se necesita abordar.

Un corpus lingüístico está constituido por un conjunto amplio de textos informatizados, que han sido producidos en situaciones reales, espontáneas o dirigidas con determinados fines y que se han seleccionado siguiendo una serie de criterios explícitos que garantizan que dicho corpus pueda ser usado como muestra representativa de la lengua que se quiere analizar. En nuestro caso nos referiremos de manera específica a muestras representativas de lengua española producida por hablantes no nativos. Los textos que constituyen un corpus están etiquetados de manera que los programas de tratamiento de los datos permiten variadas posibilidades de búsqueda y permiten realizar los análisis por entradas léxicas, por contextos, por variables diferentes que influyen de alguna manera en la enseñanza y en el aprendizaje.

Ya existen grandes cantidades de textos producidos por personas que usan el español como lengua segunda o extranjera y que comparten una serie de variables que permitirían su comparación analítica, pero no están disponibles. Por ejemplo, se podrían poner a disposición de la comunidad investigadora todos los exámenes escritos de los DELE —Diploma de español como lengua extranjera— que conserva la Universidad de Salamanca desde hace ya casi dos décadas, con dos convocatorias anuales en los diferentes continentes.5 También podrían constituir un excelente Corpus de textos escritos en español no nativo los exámenes que realiza la Universidad Autónoma de México para la expedición del certificado CELA, Certificado de Español como Lengua Adicional, que son pruebas que diagnostican el grado de idoneidad de los candidatos en función de su competencia lingüística y comunicativa para desenvolverse principalmente en los ámbitos público y privado.6 Al tratarse de un examen que se aplica de forma electrónica, no resultaría difícil constituir un banco de datos público que sirviera de base a la investigación. Del mismo modo, existe una gran cantidad de exámenes que realizan los que aprenden español en Argentina, para obtener el CELU —Certificado de Español, Lengua y Uso—,7 gestionado por el Consorcio Interuniversitario para la evaluación del conocimiento y el uso del español.

Ainciburu (2010) ofrece una descripción completa de los proyectos de construcción de corpus de producciones orales y escritas de estudiantes de español como lengua extranjera en diferentes instituciones, en particular en universidades europeas y americanas. Entre ellos se puede destacar el Corpus de producciones orales de estudiantes anglohablantes (Mitchell, 2008). SPLLOC: a new database for Spanish second language acquisition research, que utiliza tres tareas de elicitación para los anglófonos que aprenden español y, para tener un término de comparación, recoge también los datos de un grupo de hablantes nativos. Tienen como objetivo investigar el programa de adquisición de las propiedades morfosintácticas del español: orden de las palabras, pronombres clíticos, morfología verbal y formas interrogativas, atendiendo a las secuencias de desarrollo de ELE. También Tracy-Ventura (2008) ofrece datos de producción oral en español L2, recogidos en aulas de escuelas y universidades de Inglaterra, utilizando una serie de tareas de elicitación mediante narración, descripción de imágenes, debate sobre un determinado tema y una entrevista individual, con 3 niveles. Es digno de mención el corpus del Grupo de investigación Woslac (2007) Proyecto CEDEL2 de la Universidad Autónoma de Madrid, que se enmarca dentro de las directrices generales de otros proyectos europeos para la creación de grandes corpus escritos de segundas lenguas. Consta de redacciones de alumnos ELE anglófonos, de 500 palabras cada una, que fueron realizadas sobre temas predeterminados. Koike (2007) ofrece el Spanish Learner Corpus and Exercises (SLCE) de la Universidad de Texas, con el propósito de proporcionar datos a los alumnos de español para familiarizarlos con el idioma que se aprende en los diferentes niveles así como servir como corpus de datos de alumnos de español que puedan ser utilizados en proyectos de investigación más avanzados de pregrado y postgrado.

En España, un grupo de investigadoras de la Universidad de Alcalá trabaja en un Corpus de producciones escritas de estudiantes ELE de diferentes lenguas, Cestero, Penadés y otros (2001) Corpus para el Análisis de errores de aprendices de E/LE (CORANE), reúne más de mil escritos, recogidos, almacenados y etiquetados, de informantes de diferentes niveles de dominio de ELE, que tienen muy variadas lenguas maternas como japonés, inglés, alemán, francés, sueco, italiano, portugués, japonés, coreano, chino, turco, húngaro, polaco, griego, árabe, ruso, holandés, entre otras. Una de las ventajas de este corpus es que las fichas por estudiante permiten trabajar con la producción longitudinal de un mismo informante.

En Brasil, Tagnin, S. (2002) USP Multilingual Learner Corpus (MLC), disponen de un corpus que contiene las composiciones en inglés, español y alemán de alumnos de la Universidad de San Pablo.

Existen otros proyectos avanzados de corpus de textos no nativos con objetivos contrastivos y análisis de errores e interlengua. Gilquin, Gaëtanelle, Papp y Diez-Bedmar (2008) comparan las producciones de los alumnos con otras pertenecientes a un corpus de nativos o con datos de otros alumnos procedentes de la misma lengua materna.

Aunque en los últimos años se han desarrollado proyectos para la elaboración de diferentes corpus y bases de datos como las que hemos reseñado, persiste una necesidad metodológica importante de elaborar bancos de datos longitudinales de ELE, de niños y adultos, en diferentes contextos de adquisición del español. Estos corpus son difíciles de conseguir por su coste en el seguimiento de los informantes, aunque podrían recogerse al menos dentro de programas estructurados en los que los alumnos siguen cursos de ELE durante varios cursos académicos.

Las grandes ventajas de los corpus de datos para la investigación en lenguas extranjeras han sido explicitadas claramente por numerosos investigadores (Sinclair, 2004; Tognini Bonelli, 2000; McCullough, 2001; Pérez, 2002)  ya que permiten analizar estructuras y los elementos léxicos en contexto, en uso, registrando la variación y la variabilidad, esenciales en la interlengua; facilitan el contraste entre lenguas maternas y la producción en lengua extranjera, el análisis de errores, las dificultades y las facilidades de cada grupo lingüístico. Esto significa que un corpus no es simplemente una colección de textos en la lengua que se quiere estudiar y analizar, sino que es algo remarcable debido a las propiedades que adquiere si está bien diseñado y construido cuidadosamente.

Los corpus facilitan el estudio del contexto en el discurso escrito y en el discurso hablado, así como el estudio de las funciones comunicativas, de las variables sociolingüísticas: edad, procedencia, nivel sociocultural, años de estudios, influencia de LM, influencia de otras L2 tipológicamente más cercanas a la lengua objeto. Y muy especialmente los corpus facilitan la realización de experimentos contrastables y replicables por otros investigadores, desde perspectivas lingüísticas y didácticas.

4. A modo de conclusión

Hemos tratado de mostrar en esta ponencia los avances que se están haciendo en el ámbito de la investigación aplicada a la enseñanza del español como segunda lengua, así como a la formación de profesores y de profesionales que trabajan en este sector, tanto en la docencia, como en el mundo editorial para el diseño de nuevos materiales didácticos, convencionales y en soportes digitales.

Los progresos en la investigación han sido muy notorios en las dos últimas décadas, tanto en la lingüística aplicada como en la didáctica, desde perspectivas variadas y multidisciplinares, como la pragmática, la sociolingüística, la lingüística cognitiva y descriptiva, el análisis del discurso, el proceso de aprendizaje, el análisis de interlengua. Desde todos estos campos y enfoques se ha reiterado el hecho de que las investigaciones actuales en la enseñanza y el aprendizaje del español como lengua no nativa (LE y L2) requieren la creación de bancos de datos de lengua española producida por hablantes no nativos, que reúnan condiciones de fiabilidad y de estandarización, de modo que se pueda contar con un corpus de datos longitudinales y un corpus de datos transversales de informantes con diferentes niveles de dominio lingüístico en Español como Lengua Extranjera, con diferentes lenguas maternas y en diferentes contextos de adquisición.

La existencia de los corpus de español no nativo permitirá describir las fases por las que pasan los aprendices, los tipos de errores de desarrollo de cada etapa y aquellos errores que tienen a la fosilización, en particular en hablantes determinadas lenguas maternas. Los datos recogidos en los corpus permitirán contar con una base empírica para analizar las pruebas y las tareas de evaluación del avance en el nivel de dominio lingüístico adquirido y mejorarlos, ya que las pruebas existentes no satisfacen todas estas necesidades. La certificación lingüística debe ser objeto de una amplia y profunda investigación que atienda a parámetros comunes de la realidad hispanohablante, a las diferencias de usos y registros, tanto geodialectales como socioculturales. Pero al mismo tiempo debe atender a niveles comunes de referencia, que faciliten la elaboración de pruebas capaces de medir y certificar, según las indicaciones de nivel de destreza propuestas en documentos internacionales como el Marco común europeo de referencia para las lenguas (2001) y los producidos por diferentes organismos e instituciones en América y Europa.

Por las razones arriba comentadas, parece imprescindible la creación de un banco de datos de interlengua española, que reúna las condiciones de fiabilidad y de estandarización de los datos, de modo que se pueda contar con un corpus de datos longitudinales y un corpus de datos transversales, de diferentes informantes con diferentes niveles de dominio lingüístico en ELE, con diferentes lenguas maternas y en diferentes contextos de adquisición.

Referencias bibliográficas

  • Ainciburu, C. (2010): «Al día», sección de la Revista Nebrija de Lingüística aplicada, n.º 7, disponible en http://www.nebrija.com/revista-linguistica/index.html
  • Cestero Mancera, A. Mª, Penadés Martínez, I., Blanco Canales, A., Camargo Fernández, L. y Simón Granda, J.(2002): «Corpus para el análisis de errores de aprendices de E/LE (CORANE)», A. M. Gimeno Sanz (ed.), Tecnologías de la información y de las comunicaciones en la enseñanza de E/LE, Actas del XII Congreso Internacional de ASELE, 5-8 de septiembre de 2001, Valencia: UPV, pp. 527-534. Disponible en http://cvc.cervantes.es/ensenanza/biblioteca_ele/asele/pdf/12/12_0527.pdf
  • Llisterri, J. (1997): «Transcripción, etiquetado y codificación de corpus orales», en el Seminario de Industrias de la Lengua, Curso "Etiquetación y extracción de información de grandes corpus textuales", Fundación Duques de Soria, disponible en http://liceu.uab.es/~joaquim/publicacions/FDS97.html
  • Mitchell, R. (2008). SPLLOC: A new database for Spanish second language acquisition research. University of Southampton.
  • Tracy-Ventura, N. (2008). Spanish Learner Language Oral Corpus project (SPLLOC 1). A New Corpus of Oral L2 Spanish. Actualmente en http://www.splloc.soton.ac.uk/ y en Talkbank (http://www.talkbank.org/).
  • Penadés Martínez, I. (2005): «Corpus para el análisis de errores en el aprendizaje de E/LE: Presentación», en LINRED: Revista electrónica de lingüística Informaciones sobre cuestiones lingüísticas, n.º 3, disponible en http://www.linred.es/informacion_pdf/informacion8_19092005.pdf
  • Pérez, C. (2002), «Explotación de los corpora textuales informatizados para la creación de bases de datos terminológicas basadas en el conocimiento», Estudios de Lingüística Española (ELiEs), Universidad de Málaga. Disponible en http://elies.rediris.es/elies18/
  • REAL ACADEMIA ESPAÑOLA, Banco de datos (CREA) [en línea]. Corpus de referencia del español actual. Disponible en: http://www.rae.es/
  • Sinclair, J. McH (2004), How to use corpora in Language Teaching, Amsterdam, John Benjamins Publishing.
  • Tognini Bonelli, E. (2000): Corpus Classroom Currency. Darbai ir Dienos, Issue no.50 /2009 Vytauto Didžiojo Universitetas, Lituania. Disponible en: http://donelaitis.vdu.lt/publikacijos/bonelli.pdf

Algunos Corpus de español no nativo

  • Alvarez López, F. (2005): Corpus de textos académicos producidos por estudiantes universitarios extranjeros. (62 redacciones de exámenes) LINRED, n.º: 3
  • Boudali, I. (2005): Corpus de textos escritos por alumnos tunecinos de enseñanza secundaria estudiantes de E/LE. (23 redacciones), LINRED, n.º: 3
  • García, M. (2005): Corpus de Conversaciones en Español como Lengua Extranjera. (9 conversaciones entre estudiantes universitarios en Alemania), LINRED, n.º: 3
  • Grupo de investigación Woslac (2007) Proyecto CEDEL2. Universidad Autónoma de Madrid. Disponible en http://www.uam.es/woslac/cedel2.htm
  • Gilquin, Gaëtanelle, Szilvia Papp y María Belén Diez-Bedmar (Eds.) (2008). Linking up contrastive and learner corpus research. Amsterdam: Rodopi.
  •  Gutiérrez Quintana, E. (2005): Corpus de textos escritos por universitarios italianos estudiantes de ELE (44 redacciones de estudiantes italianos en contexto académico), LINRED, n.º: 3.
  • Koike, N. (2007): Spanish Learner Corpus and Exercises (SLCE) de la Universidad de Texas. Disponible en http://www.laits.utexas.edu/slce
  • Lin, Tzu-Ju (2005): Corpus de textos escritos por universitarios taiwaneses estudiantes de español (185 redacciones de estudiantes en Taiwan), LINRED, n.º: 3.
  • Mitchell, R. (2008). SPLLOC:A new database for Spanish second language acquisition research. University of Southampton.
  • Penadés Martínez, I. (2005): «Corpus para el análisis de errores en el aprendizaje de E/LE: Presentación», en LINRED: Revista electrónica de lingüística Informaciones sobre cuestiones lingüísticas, n.º 3, disponible en http://www.linred.es/informacion_pdf/informacion8_19092005.pdf
  • Tagnin, S. (2002) USP Multilingual Learner Corpus (MLC). Departamento de Lenguas modernas de la Universidad de San Pablo (Brasil)
  • Tracy-Ventura, N. (2008). Spanish Learner Language Oral Corpus project (SPLLOC 1). A New Corpus of Oral L2 Spanish. Actualmente en http://www.splloc.soton.ac.uk/ y en Talkbank (http://www.talkbank.org/).

Notas

  • 1. Se pueden escuchar las entrevistas realizadas y las ponencias del Simposio «25 años de ELE» en la página del Instituto Cervantes, disponible en http://www.cervantestv.es/ihd/ihd.asp. Volver
  • 2. En la búsqueda de la base de datos de tesis doctorales de las universidades española, en marzo 2010, aparecen registradas 48 tesis con el sintagma «español como lengua extranjera», 10 tesis con «español como lengua segunda» y 35 tesis con «análisis de errores / interlengua». Conocemos la existencia de varias tesis sobre el tema en universidades de Hispanoamérica, pero no tenemos acceso al registro de las mismas. Volver
  • 3. De las que se publican en español, podemos destacar Estudios de Lingüística aplicada, publicación del Centro de Enseñanza de Lenguas extranjeras de la Universidad Nacional Autónoma de México. ISSN Impreso:0185-2647; RÆL-Revista electrónica de lingüística aplicada, publicación de la Asociación Española de Lingüística Aplicada (AESLA). ISSN: 1885-9089; Revista española de lingüística aplicada (RESLA), publicación de la Asociación Española de Lingüística Aplicada (AESLA). ISSN: 0213-2028; Revista Nebrija de Lingüística aplicada, publicada por el Departamento de Lenguas aplicadas de la Universidad Nebrija, en formato electrónico. ISSN 1699-6569; RLA. Revista de lingüística teórica y aplicada, versión on-line, publicada por la Universidad de Concepción, Chile. ISSN 0718-4883; Lengua y migración, publicada por la Universidad de Alcalá, ISSN:1889-5425. Volver
  • 4. Técnicas de la información y comunicación combinadas con el aprendizaje de lenguas, elaborada por un equipo transnacional e interdisciplinar en el marco del programa europeo SÓCRATES, dirigido por Graciela Vázquez (ULB, Berlín). Volver
  • 5. Toda la información sobre los exámenes DELE se encuentra disponible en http://diplomas.cervantes.es/index.jsp. Volver
  • 6. Toda la información sobre los exámenes CELA se encuentra disponible en http://www.cepe.unam.mx/cepe.php?tema=cela. Volver
  • 7. Toda la información sobre los exámenes CELU se encuentra disponible en http://www.idiomas.filo.uba.ar/extranjeros/espanol/certificados/dominio.htm#celu. Volver