Floating topic
Uso de corpus
Contestar las preguntas de los estudiantes sobre los fenómenos lingüísticos no mencionados en libros de texto
Reconocer sinónimos y casi-sinónimos, así como las colocaciones
Mostrar cómo las estructuras sintácticas pueden indicar diferencias en el significado
posibles problemas
Actividades basadas en los corpus - inadecuadas para algunos alumnos
Estudiantes – reticencia al uso del método inductivo
Demostrar la variación en la gramática
Crear ejercicios
Útil para el trabajo en clase
Ideas clave
Escaso uso de los corpus en una clase de lengua extranjera:
Falta de interés por parte de los profesores
Falta de destrezas y conocimientos por parte de los profesores para utilizar los corpus en clase
Facilidad de acceso a los corpus en línea
El aprendiz como un investigador:
Uso de los corpus con textos auténticos sin ideas preconcebidas
Lingüística de corpus: áreas de aplicación
Lexicografía y creación de diccionarios
Estudio de la pragmática
Análisis de lenguajes especializados
Análisis del uso del lenguaje
Lingüística forense:
Análisis del discurso
Traducción y estudios de traducción
Investigación sociolingüística
Psicolingüística y adquisición del lenguaje
Enseñanza de lenguas
Desarrollo de tecnologías del lenguaje
Tipos de anotación
Part of speech
incorporación de etiquetas
Anotación semántica
categoría semántica de las palabras
Anotación sintáctica
estructura sintáctica de una oración: sintagmas y oraciones subordinadas
Anotación discursiva
coreferencia en un texto (relaciones anafóricas)
Anotación pragmática
información sobre los actos del habla en la interacción oral
Anotación fonética/prosódica
anotación fonética – pronunciación de una palabra en un corpus oral
anotación prosódica - la acentuación, la entonación y las pausas en un corpus oral
Antes de la anotación
Procesos automáticos llevados a cabo por las herramientas de análisis de corpus
Tokenización
Token: un uso de una palabra en su forma concreta en un corpus separada por un espacio en blanco
Lematización
Proceso de asignación de lema a sus formas flexionadas en el corpus
Segmentación
Es la separación de la raíz (lexema) de los morfemas de flexión
Anotación de corpus
Markup : información objetiva y verificable
Corpus NO anotado
Texto sencillo y plano
Información lingüistica - implícita
Corpus anotado
Informaciónlingüísticarelevante-explícita
Codificación intertextual
Aspectos referentes a la configuración formal del texto
Aspectos extratextuales
Identificación y clasificación del texto para su recuperación
La anotación es informacion linguistica de tipo interpretativo para describir los usos del lenguaje
Lingüística de Corpus
Se ocupa de recopilar textos escritos o transcripciones de la produccion oral en forma de corpus
Caracteristicas de un corpus
Función
Tipos de corpus
Criterios para la selección de textos
Equilibrio
Muestreo
Criterios internos se definen de forma linguistica
Criterios externos tienen en cuenta la situacion de comunicación
Corpus General: proporciona infórmacion completa sobre una lengua
Corpus monitor: crece continuamente
Corpus especializado: textos representativos
Corpus monolingüe /Corpus multilingüe
Corpus paralelos / Corpus comparable
Corpus de aprendientes corpus sincronico / diacronico
Reutilización y replicabilidad
Disponibilidad y viabilidad
Formato
Tratamiento del texto
Tamaño
muestreo y representatividad
Un corpus es un conjunto de fragmentos de textos orales o escritos que son utilizados de forma científica para analizar un lenguaje.