Compartir

Tipos de refuerzo: concepto y índices de refuerzo

Tipos de refuerzo: concepto y índices de refuerzo

Skinner al tratar sobre las respuestas operantes dirá: "Una operante es una parte identificable de la conducta de la que puede decirse, no que sea imposible hallar un estímulo que la provoque (....) sino que, en las ocasiones en que se observa su ocurrencia, no puede detectarse ningùn estímulo correlacionado.

El formulador de la ley del efecto fue E. L. Thorndike (1874-1949). Thorndike defiende que en aquellas situaciones en las que la desaparición de una estimulación aversiva produce un estado "satisfactorio", los efectos reforzantes de este tipo de situaciones deberían interpretarse como la primera formulación de la ley del efecto; esto es, aquéllas en las que la desaparición de la estimulación aversiva sea gratificante, deben ser interpretadas como una bùsqueda en la desaparición de esta estimulación.

También te puede interesar: Concepto y teorías de la Motivación

Introducción al problema del refuerzo

Al siguiente hecho lo denominaremos la ley empírica del efecto: empíricamente, la consecuencia que una respuesta lleva consigo es un determinante poderoso de si la respuesta se fijará o no B.F. Skinner (1904) ha sido quien se ha ocupado más sistemáticamente en sacar el máximo partido posible de la formulación empírica de la ley del efecto desde finales de los años 30 con una postura teórica que se ha calificado algunas veces como "empirismo descriptivo sistemático". Frente a la conducta "respondente" (controlada por condicionamiento clásico), Skinner propone la "operante", emitida por el organismo de modo espontáneo. El acercamiento skinneriano al problema del refuerzo no es teórico en el sentido tradicional sino empírico-descriptivo.

A nivel descriptivo, algunos eventos que siguen a las respuestas tienen el efecto de incrementar la probabilidad de que estas respuestas se repitan. Estos eventos son definidos e identificados como refuerzos o reforzadores, en función de sus efectos observables y no en función del efecto que puedan tener sobre los mecanismos y procesos "internos" del organismo, sean éstos neuronales o no. Estos eventos, denominados refuerzos o reforzadores, pueden ser de dos tipos:

  • Refuerzo positivo: "Aquel cuya presencia fortalece o incrementa la probabilidad de que una acción aparezca en el futuro".
  • Refuerzo negativo: "Aquel cuya desaparición fortalece o incrementa la probabilidad de que una acción aparezca en el futuro (justo la que ha llevado consigo o se relacione con la desaparición de la estimulación aversiva)".

Tanto en Skinner como en Thorndike, la acción del refuerzo es automática y, en principio, al margen de la conciencia y/o actividad consciente del organismo. El refuerzo actúa de modo automático.

Conceptos básicos, tipos de refuerzo

Se estudia como un acontecimiento que aparece espontáneamente con una frecuencia dada". Las respuestas operantes pueden ser divididas en instrumentales y consumatorias:

  • Respuesta instrumental: "Cuando es realizada por un organismo y se encuentra encaminada a la consecución de una meta".
  • Respuestas consumatorias: "Aquellas respuestas que realiza un organismo justo en la consecución de la meta (comer, copular, beber, etc.)".

Para llevar a cabo el análisis de las respuestas nos interesa distinguir dos conceptos:

  1. Tasa: Es el nùmero de respuestas que se da por unidad de tiempo y se presenta usualmente mediante gradientes de adquisición o extinción (se dice, así, que una respuesta posee una tasa o un gradiente más acelerado o más pronunciado que otra).
  2. Nivel asintónico de respuesta: Es el nivel máximo de adquisición y que no se incrementa con posteriores intentos.

Otra división que podemos hacer sobre los refuerzos es ésta:

  1. Refuerzos primarios: Aquellos que poseen un valor reforzante biológicamente determinado y no por aprendizaje, tal y como ocurre en el caso del aire, comida y bebida.
  2. Refuerzos secundarios: Aquellos que han adquirido su valor por aprendizaje tales como la recompensa social (alabanza) o el dinero.

Condicionamiento instrumental Se distinguen cuatro tipos de condicionamiento instrumental (uno positivo y tres negativos)

El entrenamiento de recompensa: El refuerzo utilizado es positivo y no se encuentra presente antes de la realización de la respuesta deseada. En cuanto aparece la respuesta se aplica el refuerzo. Por ejemplo: cada vez que una rata apretaba una palanca se presentaba, en un cánula, una pastillita o un grano de comida.

El entrenamiento de castigo: El refuerzo (estímulo punitivo) no se encuentra presente. Si el sujeto realiza una acción prefijada aparece el refuerzo negativo (estímulo punitivo). P. ejem: Un hijo de cinco años rompe un jarrón valioso para la madre y ésta le da un bofetón.

Los diseños de evitación: El refuerzo aversivo se encuentra ausente antes de la realización de la conducta, la realización de la respuesta adecuada lleva consigo que el refuerzo no se presente. P. ejem: el diseño de evitación de Sidman en el que se encuentra programada la aplicación de un shock eléctrico en una caja de Skinner cada 5 segundos, a menos que el animal (usualmente una rata) apriete una palanca. La respuesta de apretar la palanca desconecta el circuito y el animal no recibe el shock.

Los diseños de escape: El refuerzo aversivo se encuentra presente antes de la realización de la respuesta, la realización de esta respuesta lleva aparejada la desaparición de la estimulación aversiva. P. ejem: En una caja de lanzadera el animal se encuentra en un compartimento con rejilla electrificada, aparece el shock eléctrico y la respuesta del animal (saltar por encima de la barrera que separa los dos compartimentos) lleva consigo la eliminación de la estimulación aversiva.

Índices de refuerzo

Indices de refuerzo Se denominan índices de refuerzo a los modos de presentación de estos refuerzos dentro de un experimento. Los podemos dividir en:

Índices no intermitentes: La aplicación continua de refuerzos para cada respuesta que aparece (ya sea que adquiere o se extingue).

  1. Refuerzo continuo: Cada respuesta emitida por un organismo es reforzada.
  2. Extinción: No se refuerza ninguna respuesta y es un proceso similar al de extinción experimental en el condicionamiento clásico.

Índices intermitentes: La aplicación de menos volumen o nùmero de refuerzos que respuestas realizadas. Por razones de espacio solo comentaremos los índices intermitentes simples; se trata de índices relacionales entre respuestas y refuerzo o entre tiempo y refuerzo. En el caso de tomar en consideración el número de respuestas se habla de un índice de razón y si se toma en cuenta un periodo temporal se habla de un índice de intervalo.

  1. Índice de razón fija (RF): Se refuerza la respuesta correcta que emite el organismo, después de que éste ha realizado un nùmero determinado de ellas.
  2. Índices de razón variable (RV): A diferencia del caso anterior, la razón de respuesta/refuerzo es una serie aleatoria alrededor de un valor central y con un pequeño rango de variación.
  3. Índices de intervalo fijo (IF): Se refuerza la primera respuesta correcta que aparece después de un intervalo temporal dado (normalmente en minutos).
  4. Índice de intervalo variable (IV): Los refuerzos se presentan en función de una serie aleatoria de intervalos temporales y de los que ùnicamente se hace explícito el intervalo medio.

Relaciones empíricas con refuerzo positivo

Una de las principales teorías sobre la extinción es la de la extinción como interferencia de respuestas. En estas teorías la idea básica es que "la extinción no se produce debido a una inhibición y/o supresión de respuestas sino a que el sujeto aprende una respuesta alternativa que interfiere o compite con la anterior". La alternativa teórica más difundida es la llamada hipótesis de la frustración.

La idea central es que durante el periodo de adquisición el sujeto aprende la respuesta apropiada y, además, a esperar la recompensa que sigue a la respuesta. En el proceso de extinción, la experiencia de no recibir la recompensa es la que produce una frustración. Esta frustración sería la responsable de que el sujeto se comprometiese en la realización de otras respuestas. A través de varias demostraciones experimentales se ha constatado que:

  1. La frustración procedente de respuestas no reforzadas positivamente actúa como un energizador de la conducta.
  2. Existe una relación directa entre la cantidad de frustración (medida en criterios tales como velocidad de carrera) y la reducción de recompensa correspondiente a este intento.
  3. Existe una relación entre la intensidad de la frustración, el retraso en la recepción de la recompensa y número de intentos de adquisición.
  4. La frustración posee componentes aversivos de modo que algunos autores la han asimilado a diseños de castigo.

Este artículo es meramente informativo, en Psicología-Online no tenemos facultad para hacer un diagnóstico ni recomendar un tratamiento. Te invitamos a acudir a un psicólogo para que trate tu caso en particular.

Si deseas leer más artículos parecidos a Tipos de refuerzo: concepto y índices de refuerzo, te recomendamos que entres en nuestra categoría de Psicología básica.

Escribir comentario sobre Tipos de refuerzo: concepto y índices de refuerzo

¿Qué te ha parecido el artículo?

Tipos de refuerzo: concepto y índices de refuerzo
Tipos de refuerzo: concepto y índices de refuerzo
Volver arriba