Категории: Все - enseñanza - corpus - gramática - análisis

по Jenny Jenny 1 месяц назад

28

Lingüística de Corpus

El texto aborda el uso y la importancia de los corpus en diversos campos de la lingüística. Se destaca cómo los corpus pueden demostrar variaciones gramaticales y cómo las estructuras sintácticas pueden reflejar diferencias de significado.

Lingüística de Corpus

Floating topic

Uso de corpus

Contestar las preguntas de los estudiantes sobre los fenómenos lingüísticos no mencionados en libros de texto

Reconocer sinónimos y casi-sinónimos, así como las colocaciones

Mostrar cómo las estructuras sintácticas pueden indicar diferencias en el significado

posibles problemas
Actividades basadas en los corpus - inadecuadas para algunos alumnos
Estudiantes – reticencia al uso del método inductivo

Demostrar la variación en la gramática

Crear ejercicios

Útil para el trabajo en clase

Ideas clave

Escaso uso de los corpus en una clase de lengua extranjera:
Falta de interés por parte de los profesores

Falta de destrezas y conocimientos por parte de los profesores para utilizar los corpus en clase

Facilidad de acceso a los corpus en línea

El aprendiz como un investigador:
Uso de los corpus con textos auténticos sin ideas preconcebidas

Lingüística de corpus: áreas de aplicación

Lexicografía y creación de diccionarios

Estudio de la pragmática
Análisis de lenguajes especializados

Análisis del uso del lenguaje

Lingüística forense:

Análisis del discurso

Traducción y estudios de traducción

Investigación sociolingüística
Psicolingüística y adquisición del lenguaje

Enseñanza de lenguas

Desarrollo de tecnologías del lenguaje

Tipos de anotación

Part of speech

incorporación de etiquetas
Anotación semántica
categoría semántica de las palabras
Anotación sintáctica

estructura sintáctica de una oración: sintagmas y oraciones subordinadas

Anotación discursiva

coreferencia en un texto (relaciones anafóricas)

Anotación pragmática

información sobre los actos del habla en la interacción oral

Anotación fonética/prosódica

anotación fonética – pronunciación de una palabra en un corpus oral

anotación prosódica - la acentuación, la entonación y las pausas en un corpus oral

Antes de la anotación

Procesos automáticos llevados a cabo por las herramientas de análisis de corpus

Tokenización
Token: un uso de una palabra en su forma concreta en un corpus separada por un espacio en blanco
Lematización
Proceso de asignación de lema a sus formas flexionadas en el corpus
Segmentación
Es la separación de la raíz (lexema) de los morfemas de flexión

Anotación de corpus

Markup : información objetiva y verificable

Corpus NO anotado
Texto sencillo y plano Información lingüistica - implícita
Corpus anotado

Informaciónlingüísticarelevante-explícita

Codificación intertextual
Aspectos referentes a la configuración formal del texto
Aspectos extratextuales
Identificación y clasificación del texto para su recuperación

La anotación es informacion linguistica de tipo interpretativo para describir los usos del lenguaje

Lingüística de Corpus

Se ocupa de recopilar textos escritos o transcripciones de la produccion oral en forma de corpus

Caracteristicas de un corpus
Función
Tipos de corpus

Criterios para la selección de textos

Equilibrio

Muestreo

Criterios internos se definen de forma linguistica

Criterios externos tienen en cuenta la situacion de comunicación

Corpus General: proporciona infórmacion completa sobre una lengua

Corpus monitor: crece continuamente

Corpus especializado: textos representativos

Corpus monolingüe /Corpus multilingüe

Corpus paralelos / Corpus comparable

Corpus de aprendientes corpus sincronico / diacronico

Reutilización y replicabilidad
Disponibilidad y viabilidad
Formato
Tratamiento del texto
Tamaño
muestreo y representatividad
Un corpus es un conjunto de fragmentos de textos orales o escritos que son utilizados de forma científica para analizar un lenguaje.