Cómo funcionan los programas de refuerzo

¿Qué es un programa de refuerzo?

 Muy bien / JR Bee 


Los programas de reforzamiento desempeñan un papel importante en el condicionamiento operante , que es un proceso de aprendizaje en el que se adquieren y modifican nuevas conductas mediante su asociación con consecuencias. Reforzar una conducta aumenta la probabilidad de que vuelva a ocurrir en el futuro, mientras que castigarla disminuye la probabilidad de que se repita.

¿Por qué son tan importantes los programas de refuerzo? El momento y la frecuencia con que reforzamos una conducta pueden tener un impacto dramático en la fuerza y ​​la velocidad de la respuesta.

En este artículo se analiza qué son los programas de refuerzo, los diferentes programas que se pueden utilizar y cuál es el mejor en función de los objetivos de aprendizaje.

¿Qué son los programas de refuerzo?

Los programas de refuerzo son reglas que establecen qué casos de conducta se reforzarán. En algunos casos, una conducta puede reforzarse cada vez que ocurre. En otras ocasiones, una conducta puede no reforzarse en absoluto.

Como parte del condicionamiento operante se puede utilizar tanto  el refuerzo positivo  como  el negativo  . En ambos casos, el objetivo del refuerzo es reforzar una conducta para que tenga más probabilidades de repetirse.

Los programas de refuerzo se llevan a cabo tanto en situaciones de aprendizaje que ocurren de manera natural como en situaciones de entrenamiento más estructuradas. En situaciones del mundo real, es probable que las conductas no se refuercen cada vez que ocurren. En situaciones en las que se intenta reforzar intencionalmente una acción específica (como en la escuela, en los deportes o en el entrenamiento de animales), se debe seguir un programa de refuerzo específico.

Algunos programas se adaptan mejor a determinados tipos de situaciones de entrenamiento. En algunos casos, el entrenamiento puede requerir un programa y luego cambiar a otro una vez que se haya enseñado el comportamiento deseado. Las dos formas fundamentales de programas de refuerzo se denominan refuerzo continuo y refuerzo parcial.

Programas continuos de refuerzo

En el refuerzo continuo, la conducta deseada se refuerza cada vez que ocurre. Este programa se utiliza mejor durante las etapas iniciales del aprendizaje para crear una asociación fuerte entre la conducta y la respuesta.

Imagina, por ejemplo, que estás intentando enseñarle a un perro a estrechar tu mano. Durante las etapas iniciales del aprendizaje, seguirías un programa de refuerzo continuo para enseñar y establecer el comportamiento. Esto podría implicar agarrar la pata del perro, sacudirla, decir “da la mano” y luego ofrecerle una recompensa cada vez que realices estos pasos. Con el tiempo, el perro comenzará a realizar la acción por sí solo.

Los programas de refuerzo continuo son más eficaces cuando se trata de enseñar una nueva conducta. Estos programas denotan un patrón en el que cada respuesta definida de forma precisa va seguida de una consecuencia definida de forma precisa.

Programas Parciales de Refuerzo

Una vez que la respuesta está firmemente establecida, un programa de refuerzo continuo suele cambiarse a un programa de refuerzo parcial. En el refuerzo parcial (o intermitente), la respuesta se refuerza solo una parte del tiempo. Las conductas aprendidas se adquieren más lentamente con el refuerzo parcial, pero la respuesta es más resistente a  la extinción .

Piense en el ejemplo anterior en el que estaba entrenando a un perro para que sacudiera la lengua. Si bien inicialmente utilizó un refuerzo continuo, reforzar la conducta cada vez, mucho después de que el perro haya aprendido el truco, es simplemente irreal. Con el tiempo, cambiaría a un programa parcial para proporcionar refuerzo adicional una vez que la conducta se haya establecido o después de que haya pasado un tiempo considerable.

Existen cuatro programas de reforzamiento parcial. Dos son programas de razón, que se basan en la cantidad de respuestas que se han producido. Los otros dos son programas de intervalo o programas basados ​​en el tiempo transcurrido.

Estos cuatro programas de reforzamiento a veces se denominan FR, VR, FI y VI (que significan proporción fija, proporción variable, intervalo fijo e intervalo variable).

Programas de proporción fija

Los programas de proporción fija  son aquellos en los que una respuesta se refuerza solo después de un número específico de respuestas. Este programa produce una tasa alta y constante de respuesta con solo una breve pausa después de la administración del reforzador. Un ejemplo de un programa de proporción fija sería entregar una bolita de comida a una rata después de que presione una barra cinco veces.

Programas de proporción variable

Los programas de proporción variable  se dan cuando una respuesta se refuerza después de una cantidad impredecible de respuestas. Este programa crea una tasa alta y constante de respuestas. Los juegos de azar y de lotería son buenos ejemplos de una recompensa basada en un programa de proporción variable. En un entorno de laboratorio, esto podría implicar entregar bolitas de comida a una rata después de presionar una barra una vez, nuevamente después de presionarla cuatro veces y nuevamente después de presionarla dos veces.

Horarios de intervalo fijo

Los programas de intervalo fijo  son aquellos en los que la primera respuesta se recompensa solo después de que haya transcurrido una cantidad de tiempo específica. Este programa provoca una gran cantidad de respuestas cerca del final del intervalo, pero una respuesta más lenta inmediatamente después de la administración del reforzador. Un ejemplo de esto en un entorno de laboratorio sería reforzar a una rata con una pastilla de laboratorio por la primera vez que presione la barra después de que haya transcurrido un intervalo de 30 segundos.

Programas de intervalos variables

Los programas de intervalo variable  se dan cuando se otorga una recompensa por respuesta después de que ha transcurrido una cantidad de tiempo impredecible. Este programa produce una tasa de respuesta lenta y constante.

Un ejemplo de esto sería entregar una bolita de comida a una rata después de presionar la barra por primera vez después de un intervalo de un minuto; una segunda bolita para la primera respuesta después de un intervalo de cinco minutos; y una tercera bolita para la primera respuesta después de un intervalo de tres minutos.

 Horario parcial Momento del refuerzo  Tasa de respuesta
Relación fija (FR) Después de un número determinado de respuestas Alto, constante
Relación variable (VR) Después de un número impredecible de respuestas Alto, constante
Intervalo fijo (FI) Después de un período de tiempo específico Alto cerca del final del intervalo, pero más lento directamente después de la administración del reforzador
Intervalo variable (VI) Después de un período de tiempo impredecible Lento, constante

Horarios de reforzamiento y extinción

Una vez que se detiene un refuerzo, la respuesta comienza a disminuir. Esto se conoce como extinción, o el tiempo que la respuesta continúa cuando ya no se aplica el refuerzo. Por lo general, los programas fijos de refuerzo son más propensos a la extinción, mientras que los programas variables son más resistentes.

La extinción puede producir efectos secundarios indeseables. Uno de ellos se denomina explosión de respuesta, que se produce cuando la respuesta aumenta temporalmente en cantidad, magnitud o duración antes de extinguirse. Otro es la variabilidad de la respuesta, que a menudo incluye el desarrollo de otras conductas problemáticas para obtener la misma respuesta.

Ejemplos de Programas de Refuerzo

Los programas de refuerzo se pueden aplicar en diferentes contextos. Se pueden utilizar en el ámbito educativo, por ejemplo, para reforzar a los alumnos después de que hayan completado una determinada cantidad de tareas o después de que hayan pasado un tiempo determinado sin problemas de conducta.

Un ejemplo de uso de un programa de refuerzos en una situación de crianza es cuando se enseña a un niño a ir al baño. Se puede empezar dándole al niño un caramelo cada vez que use el orinal (proporción fija). Luego, se puede pasar a proporcionar refuerzos solo después de usar el orinal varios días seguidos (ya sea a intervalos fijos o variables).

Los programas de refuerzo también se pueden utilizar en el análisis conductual aplicado o ABA. En este caso, los reforzadores se utilizan para mejorar algún tipo de comportamiento. Por ejemplo, las investigaciones han descubierto que estos programas pueden ser beneficiosos para ayudar a las personas con dificultades intelectuales o de desarrollo a mejorar las conductas de comunicación.

Utilizando el horario apropiado

La decisión de cuándo reforzar una conducta puede depender de varios factores. En los casos en los que se intenta enseñar específicamente una nueva conducta, un programa continuo suele ser una buena opción. Una vez que se ha aprendido la conducta, suele ser preferible cambiar a un programa parcial.

En la vida diaria, los programas de refuerzo parciales se dan con mucha más frecuencia que los continuos. Por ejemplo, imagina que recibieras una recompensa cada vez que llegaras a tiempo al trabajo. Con el tiempo, en lugar de que la recompensa fuera un refuerzo positivo, la negación de la recompensa podría considerarse un castigo negativo.

En cambio, este tipo de recompensas suelen distribuirse según un programa de refuerzo parcial mucho menos predecible. No sólo son mucho más realistas, sino que también tienden a producir tasas de respuesta más altas y son menos susceptibles a la extinción.

Los programas parciales reducen el riesgo de saciedad una vez que se ha establecido una conducta. Si se otorga una recompensa sin fin, el sujeto puede dejar de realizar la conducta si ya no desea o necesita la recompensa.

Por ejemplo, imagina que estás intentando enseñarle a un perro a sentarse. Si usas comida como premio cada vez, el perro podría dejar de hacerlo una vez que esté satisfecho. En esos casos, algo como elogios o atención puede ser más eficaz para reforzar un comportamiento ya establecido.

Una palabra de Verywell

El condicionamiento operante puede ser una herramienta de aprendizaje poderosa. Los programas de refuerzo utilizados durante el proceso de entrenamiento y mantenimiento pueden tener una influencia importante en la rapidez con la que se adquiere una conducta, la fuerza de la respuesta y la frecuencia con la que se manifiesta la conducta.

Para determinar qué horario es preferible, considere diferentes aspectos de la situación, incluido el tipo de comportamiento que se está enseñando y el tipo de respuesta que se desea.

3 Fuentes
MindWell Guide utiliza únicamente fuentes de alta calidad, incluidos estudios revisados ​​por pares, para respaldar los hechos incluidos en nuestros artículos. Lea nuestro proceso editorial para obtener más información sobre cómo verificamos los hechos y mantenemos nuestro contenido preciso, confiable y digno de confianza.
  1. Hulac D, Benson N, Nesmith M, Wollersheim S.  Uso de programas de refuerzo de intervalo variable para apoyar a los estudiantes en el aula: una introducción con ejemplos ilustrativosJ Educ Res Prac.  2016;16(1):90-96. doi:10.5590/JERAP.2016.06.1.06

  2. Trump CE, Ayres KM, Quinland KK, Zabala KA. Refuerzo diferencial sin extinción: una revisión de la literatura . Behav Anal Res Pract . 2020;20(2):94-107. doi:10.1037/bar0000169

  3. Muharib R, Walker V, Alresheed F, Gerow S. Efectos de múltiples programas de refuerzo en la comunicación apropiada y las conductas desafiantes: un metaanálisis . J Autism Development Disord . 2021;51:613-631. doi:10.1007/s10803-020-04569-2

Lectura adicional

  • Nevid J. Fundamentos de psicología: conceptos y aplicaciones. Cengage Learning.

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top