Validez y confiabilidad de los instrumentos de investigación para la recolección de datos
Confiabilidad: Es imprescindible probar el
cuestionario sobre un pequeño grupo de población. Esta prueba piloto ha
de garantizar las mismas condiciones de realización que el trabajo de campo
real
Método de Kuder-Richarson 20: permite obtener la confiabilidad a partir de los datos obtenidos en una sola aplicación del test.
Coefiente Alfa de Cronbach: Para evaluar la confiabilidad o la homogeneidad de las preguntas o ítemes es común emplear el coeficiente alfa de Cronbach cuando se trata de alternativas de respuestas policotómicas.
Método común de división por mitades o Hemitest: este método computa el coeficiente de correlación entre los puntajes de las dos mitades del test o cuestionario aplicado.
Interpretación del Coeficiente de Confiabilidad
El coeficiente de confiabilidad es un coeficiente de correlación, teóricamente significa la correlación del test consigo mismo. Sus valores oscilan entre 0 y 1.
Método Test-Retest: una forma de estimar la confiabilidad de un test o cuestionario es administrarlo dos veces al mismo grupo y correlacionar las puntuaciones obtenidas.
Método de Kuder-Richarson 21: permite obtener la confiabilidad a partir de los datos obtenidos en una sola aplicación del test.
Validez de Constructo: Para estudiar este tipo de validez es necesario que exista una conceptualización clara del rasgo
estudiado basado en una teoría determinada. La teoría sugiere las
tareas pruebas que son apropiadas para observar el atributo o rasgo
y las evidencias a considerarse en la evaluación.
Método del Consenso Grupal: Se reúne a los expertos en un lugar determinado, se indica al grupo que su tarea consiste en lograr una estimación de la pertinencia y otros aspectos relacionados con
la elaboración de los ítemes.
Técnica de Grupo Nominal: El primer paso es reunir a los expertos (entre ocho y diez personas) y pedirles que registren,
individualmente y sin intercambiar opiniones, sus propias
puntuaciones
Cada experto debe recibir la información escrita suficiente sobre: el propósito de la prueba (objetivos), conceptualización del universo de contenido, tabla de especificaciones o de operacionalización de
las variables del estudio.
Método de Agregados Individuales: Éste es un método económico porque, al igual que el método Delphi, no exige que se reúna a los expertos en un lugar determinado.
Los juicios de expertos se pueden obtener por métodos grupales o por métodos de experto único. Se pueden seguir, entre
otros, el método de Agregados Individuales, el método Delphi, la técnica de Grupo Nominal y el método de Consenso Grupal
Los investigadores deben elaborar una serie de ítemes, acordes con las
variables empleadas y sus respectivas dimensiones. Luego de la selección de los ítemes más adecuados para el proyecto, se elabora el instrumento, para ser validado por un grupo impar de expertos
El problema de apreciar la validez de
contenido está vinculado íntimamente con la planificación del cuestionario y
después con la construcción de los ítemes ajustados a esos planes y a los contenidos del marco teórico de la investigación. Un instrumento de medición debe tener representados a todos los ítemes del dominio de contenido de las variables a medir
Validez Predictiva o de Criterio Externo o Empírica: se asocia con la visión de futuro, determinar hasta dónde se puede anticipar
el desempeño futuro de una persona en una actividad determinada. La validez predictiva se estudia comparando los puntajes de un instrumento con una o más variables externas denominadas
variables de criterio
Factores que Afectan la Validez
:Existen varios factores que tienden a distorsionar los coeficientes de validez y a complicar su interpretación
un instrumento según Alvarado, Canales y Pineda (1994)“…es el mecanismo que utiliza el investigador para recolectar y registrar
la información”
VALIDEZ
FIABILIDAD Y VALIDEZ: se describen conceptualmente las propiedades psicométricas de fiabilidad y validez y los procedimientos para evaluarlas. El apartado dedicado a la fiabilidad o precisión de las puntuaciones de las pruebas describe los distintos modelos, procedimientos empíricos e índices estadísticos para cuantificarla. En cuanto a la validez, la propiedad psicométrica más importante y la que ha experimentado mayores transformaciones a lo largo de la historia de la Psicometría, se resumen las principales concepciones y los debates en torno a la misma.
De manera semejante, si una persona contestase a un test repetidamente en las mismas condiciones, de la variabilidad de las puntuaciones podría obtenerse un indicador de su grado de fiabilidad.
El estudio de la fiabilidad parte de la idea de que la puntuación observada en una prueba es un valor concreto de una variable aleatoria consistente en todas las posibles puntuaciones que podrían haber sido obtenidas por una persona en repeticiones del proceso de medida en condiciones semejantes
FIABILIDAD
La fiabilidad se concibe como la consistencia o estabilidad de las medidas cuando el proceso de medición se repite. La carencia de precisión podría tener consecuencias indeseables en el coste de ese producto en una ocasión determinada. De esta concepción se sigue que de la variabilidad de las puntuaciones obtenidas en repeticiones de la medición puede obtenerse un indicador de la fiabilidad, consistencia o precisión de las medidas.
La TCT es un conjunto articulado de
procedimientos psicométricos desarrollados fundamentalmente en la primera mitad del siglo pasado, que se ha utilizado extensivamente para la construcción, análisis y aplicación de los tests psicológicos y educativos
TCT permite cuantificar solamente dos componentes de la varianza de las puntuaciones observadas: la varianza verdadera y la varianza de error. La TG, concebida como una extensión de la TCT, trata de especificar la contribución a la varianza observada de un número mayor de facetas: la variabilidad entre las personas, las ocasiones en que se mide, las diferentes formas del instrumento, los diferentes calificadores y las interacciones entre los componentes.
Los psicólogos utilizan diversos procedimientos estandarizados para obtener muestras de la conducta de las personas. Estos recursos, genéricamente denominados tests, incluyen un procedimiento de puntuación que permite obtener medidas que pueden ser usadas con distintos propósitos: estimar el nivel de la personas en un constructo (ansiedad, calidad de vida, visualización espacial…)
Para estimar empíricamente los estadísticos de fiabilidad (ETM y coeficiente de fiabilidad) se emplean diversos diseños de recogida de datos que reflejan distintas repeticiones del proceso de medida. Los más conocidos se denominan test-retest (aplicación de un test a una muestra de personas en dos ocasiones entre las que el atributo se mantiene estable)
la evaluación de la fiabilidad se ha llevado a cabo mediante los procedimientos derivados de la TCT, los resultados no habrán de ser necesariamente intercambiables, puesto que los diferentes diseños de recogida de datos antes mencionados (test-retest, formas paralelas, consistencia interna, etc) aprecian distintas fuentes de error.
Respuestas de los Sujetos: Algunos factores: bloqueo de los sujetos al responder debido a situaciones emocionales y las respuestas al azar
Administración y Calificación del Instrumento: Entre estos factores están: tiempo insuficiente para responder, ayuda adicional de otros sujetos, en caso de pruebas: las chuletas o copias, la subjetividad en los puntajes de las preguntas.
La problemática al momento de la recolección de datos en la realización
de los Trabajos de investigación se centra en la construcción de los instrumentos a emplear con esta finalidad, de manera que permitan recabar información válida y confiable
Método Delphi: para obtener
la opinión de expertos de una manera sistemática. En un primer
momento, cada experto responde de manera individual y anónima a un cuestionario.
La relevancia y congruencia de los reactivos
con el contenido teórico, la claridad en la redacción y el sesgo o
tendenciosidad en la formulación de los ítemes
e la relevancia y congruencia de los reactivos con el contenido teórico, la claridad en la redacción y el sesgo o
tendenciosidad en la formulación de los ítemes
Hay que considerar que, la validez de contenido no puede expresarse
cuantitativamente es más bien una cuestión de juicio, se estima de manera
subjetiva o intersubjetiva empleando, usualmente, el denominado Juicio de
Expertos
La Validez: La validez de un instrumento consiste en que mida lo que tiene que medir. Al estimar la validez es necesario saber a ciencia cierta qué rasgos o características se desean estudiar. A este rasgo o característica se le denomina variable criterio.
Validez de Contenido: se refiere al grado en que un instrumento refleja un dominio específico del contenido de lo que se quiere medir, se trata de determinar hasta dónde los ítemes o reactivos de un instrumento son representativos del universo de contenido de la característica o rasgo que se quiere medir
Existen muchas consideraciones específicas a tomar en cuenta en la evaluación de un cuestionario; las cuales las englobaremos bajo tres encabezados principales: validez, confiabilidad y utilidad práctica
pretende orientar a los noveles investigadores en el procedimiento para elaborar instrumentos adecuados que proporcionen un basamento relevante para el logro de los objetivos planteados en la
investigación abordada y sustenten los hallazgos que se realicen.
El término constructo se usa en psicología para referirse a algo que no es observable, pero que literalmente es construido por el investigador para resumir o explicar las regularidades o relaciones que él observa en la conducta.
pretende orientar a los
noveles investigadores en el procedimiento para elaborar un instrumento adecuado para la recolección de datos, válido y confiable, que proporcione un basamento relevante para el logro de los objetivos planteados y sustente los hallazgos que realicen con sus investigaciones.