Condicionamiento Instrumental: Fundamentos. (3)

La Contingencia Respuesta-Reforzador:

La contingencia respuesta-reforzador se refiere al hecho de que la entrega del reforzador es dependientemente de la ocurrencia previa de la respuesta instrumental. La contigüidad respuesta-reforzador mas que la contingencia era el factor crítico que producía el aprendizaje instrumental. No obstante, esta visión ha resultado injustificada por la investigación posterior.

El experimento de “Superstición” de Skinner: 

El experimento de superstición de Skinner fue realizado en 1948. Skinner situó a palomas en cámaras experimentales independientes y monto el equipamiento para entregar una cantidad de comida cada 15 segundos independientemente de lo que las palomas estuvieran haciendo. Pasado un tiempo, Skinner volvió a ver lo que estaban haciendo los pájaros: La palomas parecían estar respondiendo como si su conducta controlara la entrega del reforzador, cuando, de hecho, la comida era proporcionada independientemente de la conducta. Skinner denomino a esto “conducta superticiosa“.

La explicacíon de Skinner de la conducta superticiosa  descansa en la idea de “reforzamiento accidental o adventicio”. El reforzamiento adventicio se refiere al emparejamiento accidental de una respuesta con la entrega del reforzador. Skinner sugirió que cualquier respuesta que un sujeto realizase por causalidad justo antes de conseguir la comida llegaría a fortalecerse y posteriormente incrementaría su frecuencia debido al reforzamiento adventicio. Cada emparejamiento accidental ayuda a “estampar” una respuesta particular. Los teóricos pensaron que la contigüidad temporal era el factor mas importante responsable del aprendizaje. El experimento de Skinner parecía apoyar esta conclusión.

  1. Reinterpretación del experimento de superstición: La afirmación de que la contigüidad respuesta-reforzador, mas que la contingencia, es lo mas importante para el condicionamiento instrumental ha sido puesta en duda por la evidencia empírica posterior. En un estudio Staddon y Simmelhag en 1971, intentaron replicar el experimento de Skinner. Algunas de las respuesta ocurrían de modo predominante hacia el final del intervalo entre reforzadores sucesivos. Staddon y Simmelhag denominaron a estas “respuestas terminales”. Otras actividades aumentaron en frecuencia tras la entrega de comida y  disminuían a medida que el tiempo de la próxima comida se hacía mas inmediato. Estas actividades fueron denominadas “respuestas de interín“. Las acciones que eran respuestas terminales y las que eran respuestas de ínterin no variaban mucho de una paloma a otra. La entrega de comida parecía influir solo en la fuerza de las respuestas terminales, incluso en las fases iniciales del entrenamiento. La investigación posterior ha proporcionado mucha evidencia adicional de que las presentaciones periódicas de un reforzador producen regularidades conductuales, siendo ciertas respuestas predominantes al final del intervalo entre las sucesivas presentaciones de comida, y otras respuestas predominantes al final del intervalo entre las sucesivas presentaciones de comida, y otras respuestas predominantes al principio del intervalo comida-comida. No esta claro por que Skinner no observó estas regularidades en su experimento.
  2. Explicación de la periocidad de las respuesta de ínterin y terminales:. Staddon y Simmelhag (1971) sugirieron que las respuestas terminales son respuestas típicas de la especie que reflejan la anticipación de la comida a medida que el tiempo se encuentra mas cerca de la próxima presentación de comida. “La respuesta de ínterin” es como una manifestación de otras fuentes de motivación que eran más importantes al comienzo del intervalo entre comidas, cuando la presentación de comida era improbable. La formulación alternativa mejor desarrollada es “la teoría de los sistemas de conducta” (Timberlake y Gawley, 1988; Timberlake y Lucas, 1985). De acuerdo con los sistemas de conducta, el sistema de alimentación esta activado en los animales privados de comida a los que se les proporciona periodicamente pequeñas cantidades de comida. Ocurren diferentes conductas dependiendo de cuando se entrego la ultima comida y cuando la comida va a aparecer de nuevo. Después de la entrega de la comida, el organismo desarrolla respuestas de “busqueda focalizada postcomida” que involucran actividades cerca del comedero. En medio del intervalo entre entregas de comida ( cuando es menos probable que se consiga la comida), ocurren “respuestas de búsqueda general” que alejan al sujeto del cuenco. Según se aproxima el momento de la próxima entrega de comida, los sujetos exhiben “respuestas de búsqueda focalizada“, que están de nuevo concentradas cerca del cuenco de comida. La distribución de la actividades que se desarrollan con la entrega periódica de un reforzador depende de la naturaleza de ese reforzador.

Efectos de la controlabilidad de los reforzadores: 

Una contingencia fuerte entre una respuesta instrumental y un reforzador esencialmente significa que la respuesta controla el reforzador. Con una contingencia fuerte, que el reforzador suceda depende de si ha ocurrido la respuesta instrumental.  La mayoría de la investigación se ha centrado en los efectos de control sobre la estimulación aversiva (Lolordo y Taylor, 2001; Maier y Seligman). Estudios pioneros de Seligman, Overmier y Maier, resaltan que el hallazgo mas importante fue que la exposición a una descarga incontrolable dificultaba el aprendizaje posterior. Este fenómeno se ha denominado “efecto de indefensión aprendida“. Los resultados de la investigación con humanos son ahora mas relevantes para aspectos de la psicología social y clínica que para la teoría conductual, en consecuencia, se mencionaran este tipo de trabajos solo brevemente.

  1. El diseño Triádico: El diseño incluye dos fases: La exposición y el condicionamiento. Durante la fase de exposición, un grupo de ratas ( E, por escape) es expuesto a descargas periódicas que pueden finalizar mediante la realización de una respuesta de escape. Cada sujeto del segundo grupo (A) es acoplado a un animal del grupo E y recibe las mismas descargas que el compañero del grupo E. Sin embargo los animales del grupo A no pueden hacer nada para evitar las descargas. El tercer grupo (C), no recibe descargas durante la fase de exposición pero esta confinado en el aparato tanto tiempo como los otros grupos. Durante la fase de condicionamiento, los 3 grupos reciben entrenamiento de escape-evitación. Este se realiza en una caja de lanzadera que tiene 2 compartimientos adyacentes. Los animales tienen que ir de un lado a otro entre los 2 compartimentos para evitar la descarga. El hallazgo destacable es que los efectos de la estimulación aversiva durante la fase de exposición dependen de si la descarga es o no escapable. La exposición a una descarga incontrolable (grupo A) produce una severa interrupción del aprendizaje posterior de escape-evitación. En la fase de condicionamiento, el Grupo A tipicamente muestra una actuación de escape-evitación mucho mas pobre que el grupo E y el grupo C. El grupo E a menudo aprende la tarea posterior de escape-evitación tan rápido como el grupo C, el cual no recibió descarga durante la fase de exposición. Los animales eran sensibles a las diferencia procedimentales entre la descarga escapable y la descarga inescapable. En consecuencia, la diferencia en la tasa de aprendizaje entre estos dos grupos muestra que los animales son sensibles a la contingencia respuesta-reforzador.  
  2. La hipótesis de la Indefensión Aprendida: esta basada en la conclusión de que los animales pueden percibir la contingencia entre sus conductas y la entrega de un reforzador. La hipótesis asume que durante la exposición a descargas incontrolables, los animales aprenden que las descargas son independientes de su conducta (que no pueden hacer nada). Llegan a esperar que los reforzadores continuaran siendo independientes de su conducta en el futuro. Esta ausencia de control futura debilita su habilidad para aprender una nueva respuesta instrumental. El déficit de aprendizaje ocurre por dos razones. Primero, la expectativa de falta de control reduce la motivación de los sujetos para realizar una respuesta instrumental. Segundo, la expectativa previamente aprendida de falta de control hace mas dificil para los sujetos aprender que su conducta es ahora efectiva para producir reforzamiento. Es importante distinguir la hipótesis de la indefensión aprendida del “efecto de indefension“. El efecto de indefensión aprendida es el patrón de resultados obtenidos con el diseño triádico (un aprendizaje mas pobre en el grupo A que en los grupos E y C).
  3. Deficit de actividad:Los investigadores se dieron cuenta de que el déficit de aprendizaje observado en el grupo A era resultado de que estos animales aprendían a ser inactivos en respuestas a la descarga. En algunas situaciones la descarga inescapable produce una disminución en el movimiento motor, o persistencia de la respuesta, ya a esto se deberían los posteriores deficits de actuación.
  4. Deficit Atencional. Puede que la descarga inescapable provoque que los animales presten menos atención a sus acciones. Si un animal no presta atención a su conducta, tendrá dificultad para asociar sus acciones con los reforzadores en el escape-evitación o en otras formas de condicionamiento instrumental. En un experimento Mair, Jackson y Tomie (1987) descubrieron, que los animales tienen dificultad para darse cuenta de cual de sus acciones produce la entrega del reforzador. Maier y sus colegas razonaron que la atención reducida a la conducta instrumental también podía ser aliviada mediante la introducción de una clave externa de retroalimentación de la respuesta o estímulo de marcado. Por tanto, marcar la respuesta instrumental supera el déficit de indefensión aprendida. Una de las fuentes de déficit de aprendizaje es una reducción de la atención a las respuestas que el animal realiza.
  5. Relaciones estimulares en el condicionamiento de escape: Una cuestión es por que la exposición a la descarga no es tan dañina si el animal puede realizar una respuesta para escapar de la descarga. Ahora resulta evidente que el entrenamiento de escape es mas complejo de lo que se pensaba anteriormente. El rasgo definitorio de la conducta de escape es que la respuesta instrumental tiene como consecuencia la terminación de un estimulo aversivo. En un procedimiento de escape hay también relaciones especiales estimulares que son potencialmente muy importantes. Realizar la respuesta de escape tiene como resultado claves internas de retroalimentación de la respuesta. Algunos de estos estímulos producidos, son experimentados al comienzo de la respuesta de escape, justo antes de que la descarga se retire, y se denominan “claves de retroalimentación de la terminación de la descarga”. Otros estímulos producidos por la respuesta son experimentados cuando el animal completa la respuesta, justo después de que la descarga se haya retirado al comienzo del intervalo entre ensayos. Estos se denominan “claves de retroalimentación de la señal de seguridad“. Por tanto, es mas probable que las claves contextuales de la cámara en la que se administran las descargas queden condicionadas para elicitar miedo cuando las descargas son inescapables. Un estudio sugiere que el aspecto crítico de una respuesta de escape puede ser que indica que la descarga se esta terminando. Por tanto, las señales de terminación de la descarga pueden constituir rasgos críticos de una respuesta de escape más eficaz que las señales de seguridad. la evidencia disponible indica que las diferencia significativas en como los animales afrontan la estimulacion aversiva pueden ser el resultado de diferencia en las relaciones de señal.

En resumen, el diseño triadico ha sido de un valor inclaculable para considerar la posible importancia de las contingencia respuesta-reforzador.

*Principios de conducta y aprendizaje. Edt Paraninfo. Michael Domjan. Uned. Pags 149-156. Tema 5

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Coaching Retroba't

Coaching personal i per adolescents.

Psicología útil en red...

"Como ves el futuro, determina como vives el presente"

Café La Flauta Mágica

Una actividad diferente para cada día

TODOPODEROSO

Sólo soy un humilde puto amo

Leadership Freak

Empowering Leaders 300 Words at a Time

Psicovalencia

Un blog creado para compartir recursos, herramientas, ideas, opiniones....

Inteligencia emocional y otras habilidades

Un blog para la gente que ha despertado y que desea conocerse a sí misma, así como mejorar cada día en la gestión emocional y afectiva.

Psicoanálisis y Cultura Moderna

Psicoanálisis, Poesía, Cultura, Noticias Grupo Cero

Un lugar en el viento

Un paraje donde pensar y sentir.

The Hardest Science

A psychology blog. Thoughts about the mind, science, society, and whatever else.

espacioparaelsilencio

Un espacio para libre pensadores, un silencio para libre sentidores.

Cuaderno de Cultura Científica

Nueva dirección: culturacientifica.com

La Salamanquesa

Visitanos en www.esasalamanquesa.net

Psicoteca Blog

Blog de psicología científica en castellano - Tercera Etapa

Agenda Grupo Cero

Conferencias, Recitales, Conciertos, Presentaciones

A %d blogueros les gusta esto: