APRENDIZAJE INSTRUMENTAL
ELEMENTOS
La respuesta instrumental
Variabilidad conductual contra estereotipia
La conducta requerida para el reforzamiento puede definirse como hacer algo nuevo, algo diferente a lo que el participante hizo previamente. Para cumplir con este requisito, el participante tiene que mostrar un desempeño diferente en cada ensayo. En dicho procedimiento, la variabilidad de la respuesta es la base para el reforzamiento instrumental.
El reforzamiento puede incrementar la variabilidad de la respuesta, por lo que ésta puede establecerse como una operante
Si la variabilidad no se refuerza de manera explícita, la respuesta se vuelve más estereotipada conforme avanza el condicionamiento instrumental
El reforzador instrumental
Existen aspectos del reforzador que determinan sus efectos sobre el aprendizaje y desempeño de la conducta instrumental: la cantidad y calidad, la forma en que la respuesta por una determinada cantidad y tipo de recompensa depende de la experiencia previa del organismo con otros reforzadpres
Si un reforzador es muy pequeño y de mala calidad, no logrará incrementar la respuesta instrumental.
Los efectos de la calidad y la cantidad del reforzamiento dependen de factores como la cantidad de respuestas que se requieren por cada reforzado
La eficacia de un reforzador no sólo depende de su calidad y cantidad sino también de lo que el sujeto recibió antes
El contraste positivo se refiere a la respuesta elevada por una recompensa favorable que resulta de la experiencia previa con un resultado menos atractivo
El contraste negativo se refiere a la disminución de la respuesta por una recompensa pequeña debido a la experiencia previa con un resultado más favorable. En este caso, la recompensa pequeña parece especialmente mala para
los individuos que antes experimentaron una recompensa mejor.
La relación entre respuesta y reforzador
La característica de la conducta instrumental es que ésta produce consecuencias y es controlada por ellas.
Tipos de relaciones entre una respuesta y un reforzador: Temporal, que se refiere al tiempo entre la respuesta y el
reforzador. Un caso especial de relación temporal es la contigüidad temporal, que se refiere a la entrega del reforzador inmediatamente después de la respuesta. El
Causal o contingencia entre respuesta y reforzador, se refiere al grado en que la respuesta instrumental es necesaria y suficiente para la presentación del reforzador.
ADQUISICIÓN DE LA CONDUCTA INSTRUMENTAL
La conducta que ocurre, porque
antes fue decisiva para producir ciertas consecuencias, se denomina conducta
instrumental
El condicionamiento instrumental implica a menudo la construcción, o síntesis, de una nueva unidad conductual a partir de componentes preexistentes que ya ocurrían en el repertorio del sujeto
Se emplea para producir respuestas diferentes a cualquier cosa que el sujeto haya hecho antes
CLASE DE REFORZADORES
Reforzamiento positivo
El reforzamiento positivo es un procedimiento en el que la respuesta instrumental produce un estímulo apetitivo
Existe una contingencia positiva entre la respuesta instrumental y el estímulo apetitivo. Los procedimientos de reforzamiento positivo producen un incremento en la tasa de respuestas
Castigo
La respuesta instrumental produce un evento
desagradable o aversivo. Existe una contingencia positiva entre la respuesta instrumental y el estímulo resultante (la respuesta produce el resultado), pero el resultado es un estímulo aversivo. Los procedimientos eficaces de castigo producen una disminución en la respuesta instrumental
Reforzamiento negativo
La respuesta instrumental termina un estímulo aversivo. Existe una contingencia negativa entre la respuesta instrumental y el estímulo aversivo. Los procedimientos de reforzamiento negativo incrementan la respuesta instrumental
Entrenamiento por omisión o reforzamiento diferencial de otra conducta (RDO).
La respuesta instrumental impide la entrega de un estímulo
placentero o apetitivo. Este procedimiento también implica una contingencia negativa entre la respuesta y un evento ambiental. Se prefiere al entrenamiento por omisión para desalentar la conducta humana, pues a diferencia del castigo, no supone la entrega de un estímulo aversivo
PROGRAMAS DE REFUERZO INSTRUMENTAL
Procedimientos de ensayo discreto
Cada ensayo de entrenamiento termina con la salida
del animal del aparato y en que la respuesta instrumental sólo se realiza una vez en cada ensayo, se lleva a cabo con algún tipo de laberinto.
Al inicio de cada ensayo se coloca a la rata en la caja de inicio. Luego se levanta la barrera móvil que separa la caja de inicio de la sección principal del corredor y que permite que la rata avance por el corredor hasta que llega a la caja meta, que por lo regular contiene un reforzador como agua o comida.
Puede cuantificarse midiendo la velocidad con
que el animal llega de la caja de inicio a la caja meta
Se puede medir la latencia, que en el caso de la respuesta de correr es el tiempo que le lleva al animal salir de la caja de inicio y empezar a desplazarse por el corredor.
En un laberinto en T también puede medirse el porcentaje de elecciones correctas para obtener al final la comida
Procedimientos de operante libre
En un corredor o un laberinto en T, después de que llega a la caja meta se saca al animal del aparato por un rato antes de regresarlo a la caja de inicio para el siguiente ensayo
Permiten al animal repetir, sin restricciones, una
y otra vez, la respuesta instrumental
Sirve para estudiar la conducta de manera más continua de
lo que permiten los laberintos
Una respuesta operante, como la presión de palanca, se define en términos del efecto que tiene sobre el ambiente
Sin embargo, cualquier respuesta que se requiera para producir una consecuencia deseada es una respuesta instrumental ya que es “decisiva” para producir un resultado particular
Entrenamiento del comedero y moldeamiento
La creación de nuevas respuestas por moldeamiento depende de la variabilidad inherente de la conducta.
El proceso de moldeamiento saca ventaja de la variabilidad de la conducta y genera de ese modo respuestas que son completamente nuevas en el repertorio del entrenado.
La tasa de respuestas se ha convertido en la medida principal en los estudios que emplean procedimientos de operante libre.