Psicología Online PIR Aprendizaje Conceptos básicos, tipos e índices de refuerzo

Psicología Básica: Condicionamiento Operante

Conceptos básicos, tipos e índices de refuerzo

Skinner al tratar sobre las respuestas operantes dirá: "Una operante es una parte identificable de la conducta de la que puede decirse, no que sea imposible hallar un estímulo que la provoque (....) sino que, en las ocasiones en que se observa su ocurrencia, no puede detectarse ningùn estímulo correlacionado.
Se estudia como un acontecimiento que aparece espontáneamente con una frecuencia dada".

Las respuestas operantes pueden ser divididas en instrumentales y consumatorias:

  • - Respuesta instrumental: "Cuando es realizada por un organismo y se encuentra encaminada a la consecución de una meta".
  • - Respuestas consumatorias: "Aquellas respuestas que realiza un organismo justo en la consecución de la meta (comer, copular, beber, etc.)".

Para llevar a cabo el análisis de las respuestas nos interesa distinguir dos conceptos:

  • 1.- Tasa: Es el nùmero de respuestas que se da por unidad de tiempo y se presenta usualmente mediante gradientes de adquisición o extinción (se dice, así, que una respuesta posee una tasa o un gradiente más acelerado o más pronunciado que otra).
  • 2.- Nivel asintónico de respuesta: Es el nivel máximo de adquisición y que no se incrementa con posteriores intentos.

Otra división que podemos hacer sobre los refuerzos es ésta:

  • a)- Refuerzos primarios: Aquellos que poseen un valor reforzante biológicamente determinado y no por aprendizaje, tal y como ocurre en el caso del aire, comida y bebida.
  • b)- Refuerzos secundarios: Aquellos que han adquirido su valor por aprendizaje tales como la recompensa social (alabanza) o el dinero.
Condicionamiento instrumental

Se distinguen cuatro tipos de condicionamiento instrumental (uno positivo y tres negativos)

1.- El entrenamiento de recompensa:

El refuerzo utilizado es positivo y no se encuentra presente antes de la realización de la respuesta deseada. En cuanto aparece la respuesta se aplica el refuerzo.

Por ejemplo: cada vez que una rata apretaba una palanca se presentaba, en un cánula, una pastillita o un grano de comida.

2.- El entrenamiento de castigo:

El refuerzo (estímulo punitivo) no se encuentra presente. Si el sujeto realiza una acción prefijada aparece el refuerzo negativo (estímulo punitivo).

P. ejem: Un hijo de cinco años rompe un jarrón valioso para la madre y ésta le da un bofetón.

3.- Los diseños de evitación:

El refuerzo aversivo se encuentra ausente antes de la realización de la conducta, la realización de la respuesta adecuada lleva consigo que el refuerzo no se presente.

P. ejem: el diseño de evitación de Sidman en el que se encuentra programada la aplicación de un shock eléctrico en una caja de Skinner cada 5 segundos, a menos que el animal (usualmente una rata) apriete una palanca. La respuesta de apretar la palanca desconecta el circuito y el animal no recibe el shock.

4.- Los diseños de escape:

El refuerzo aversivo se encuentra presente antes de la realización de la respuesta, la realización de esta respuesta lleva aparejada la desaparición de la estimulación aversiva.

P. ejem: En una caja de lanzadera el animal se encuentra en un compartimento con rejilla electrificada, aparece el shock eléctrico y la respuesta del animal (saltar por encima de la barrera que separa los dos compartimentos) lleva consigo la eliminación de la estimulación aversiva.

Indices de refuerzo

Se denominan índices de refuerzo a los modos de presentación de estos refuerzos dentro de un experimento. Los podemos dividir en:

1.- Índices no intermitentes:

La aplicación continua de refuerzos para cada respuesta que aparece (ya sea que adquiere o se extingue).

  • 1.1.-Refuerzo continuo: Cada respuesta emitida por un organismo es reforzada.
  • 1.2.-Extinción: No se refuerza ninguna respuesta y es un proceso similar al de extinción experimental en el condicionamiento clásico.
2.- Índices intermitentes:

La aplicación de menos volumen o nùmero de refuerzos que respuestas realizadas. Por razones de espacio solo comentaremos los índices intermitentes simples; se trata de índices relacionales entre respuestas y refuerzo o entre tiempo y refuerzo.

En el caso de tomar en consideración el número de respuestas se habla de un índice de razón y si se toma en cuenta un periodo temporal se habla de un índice de intervalo.

  • 2.1.-Índice de razón fija (RF): Se refuerza la respuesta correcta que emite el organismo, después de que éste ha realizado un nùmero determinado de ellas.
  • 2.2.-Índices de razón variable (RV): A diferencia del caso anterior, la razón de respuesta/refuerzo es una serie aleatoria alrededor de un valor central y con un pequeño rango de variación.
  • 2.3.-Índices de intervalo fijo (IF): Se refuerza la primera respuesta correcta que aparece después de un intervalo temporal dado (normalmente en minutos).
  • 2.4.-Índice de intervalo variable (IV): Los refuerzos se presentan en función de una serie aleatoria de intervalos temporales y de los que ùnicamente se hace explícito el intervalo medio.

> Siguiente: Relaciones empíricas con refuerzo positivo