Programa de refuerzo de proporción variable (ejemplos) –

El juego puede ser divertido, pero también puede resultar adictivo. Digamos que ganas $10 la primera vez que juegas a las tragamonedas. La próxima vez perderás un dólar. La próxima vez perderás otro dólar. A pesar de estas derrotas, la esperanza de otra victoria persiste en tu mente, lo que te obliga a creer que otra victoria está a la vuelta de la esquina. Esta necesidad de seguir apostando, incluso ante pérdidas, no es sólo resultado de pura suerte o azar.

El uso prolongado de las máquinas tragamonedas, donde la gente se sienta durante horas haciendo sus apuestas repetitivamente, no es una coincidencia. Estas máquinas están diseñadas deliberadamente para funcionar según un principio conocido como programa de refuerzo de relación variable. Al comprender cómo funciona este programa, se puede reconocer mejor su poderosa influencia a la hora de impulsar el comportamiento continuo del juego. Este mecanismo aprovecha nuestras respuestas psicológicas, haciéndonos persistir con la esperanza de una recompensa potencial, incluso si no está claro cuándo llegará esa recompensa.

¿Qué es el refuerzo de relación variable?

El refuerzo de proporción variable es una forma de programar refuerzos para aumentar la probabilidad de que se produzcan las conductas deseadas. El refuerzo, como el premio mayor de una máquina tragamonedas, se distribuye sólo después de que se realiza un comportamiento un cierto número de veces.

¿Cuantas veces? La respuesta varía. Tal vez la máquina tragamonedas entregue el premio mayor después de tres tiradas, o 20, o 2000. La respuesta siempre variará, manteniendo a los sujetos (o a las personas a las que se anima a realizar el comportamiento) alerta.

Esto es ligeramente diferente de un programa de refuerzo de proporción fija, en el que el refuerzo se distribuye después de una cantidad fija de respuestas. Nuevamente, si la gente supiera que ganarían el premio mayor después de 2000 tiradas de la máquina tragamonedas, habría más personas sentadas durante horas seguidas hasta llegar a la tirada número 2000. Pero no es así como funciona un programa de refuerzo de proporción variable.

Ejemplos de refuerzo de relación variable

Vegas no es el único lugar donde encontrará este programa de refuerzo de proporción variable. Comprender este programa de refuerzo también puede ayudarte a entrenar a una mascota o a entrenarte a ti mismo para realizar ciertos comportamientos.

1) entrenar una mascota

En un laboratorio, los psicólogos estudiarían el refuerzo de proporción variable con animales. Podrían entrenar a un animal para que presione un botón varias veces para recibir un premio. Las “pocas veces” variarían cada vez que se le diera la golosina al animal.

Es posible que ya hagas algo similar en casa con tu mascota, lo reconozcas o no. Tal vez repases una lista aleatoria de comandos, como «siéntate», «habla» o «abajo», antes de darle comida o un premio a tu mascota. Esta es una forma de refuerzo de proporción variable.

¡Los usuarios de Reddit ofrecieron sus consejos para usar este programa mientras entrenan mascotas!

Refuerzo de relación continua a variable

u/Disglerio314 dijo, «Empiece con continuo, para que el perro aprenda lo que significan las cosas. Luego, cambie gradualmente a variable para evitar que el perro diga «oh, el humano quiere que haga X, pero no tengo hambre en este momento, así que no creo que lo haga». ”.

Si comienzas con la variable, entonces el perro podría confundirse acerca de por qué a veces hacer X es algo bueno y recibe premios y por qué a veces no lo hace y no aprende el significado de la orden».

«Tratamiento del premio mayor»

u/cylequea dijo, «Seguiré haciendo refuerzo continuo durante varios días o incluso meses, dependiendo de cuán difícil fue el truco o el comportamiento.

El refuerzo diferencial (o tratamiento del premio mayor, como he oído llamarlo) es cuando hacen algo realmente bien. por ejemplo, nuestro perro me deja limpiarle las uñas durante mucho más tiempo de lo normal, tejer en la primera vez, etc.

El refuerzo variable solo ocurre después de que ella ha realizado un comportamiento de manera constante después de varios meses y sé que ya es parte de su vocabulario/jerga habitual Y es algo que no le importa hacer. Aún así haré un refuerzo continuo si es algo que a ella no le gusta, como la hora del baño, usar dremel, tomar medicamentos (como recibir gotas para los ojos o comer su pastilla contra el gusano del corazón), etc.»

Entrenamiento en deportes caninos

u/Twzl dijo: «Si practicas deportes caninos y siempre los entrenas, siempre tendrás que tener cosas que tu perro encuentre gratificantes, o perderás el impulso y el entusiasmo a largo plazo.

Tengo un perro que haría cualquier cosa por un juguete. Tengo una hielera pequeña para él, que tiene un montón de juguetes dentro. Cuando entrenamos, la hielera puede estar en cualquier lugar del circuito de agilidad. Siempre está en un lugar diferente, a veces ni siquiera está en el ring.

Le pido que haga una secuencia o que realice un recorrido completo y, en algún momento, normalmente verá que su hielera está ahí. Pero no puede conseguir los juguetes. Lo que termino con un perro hiperimpulsor y concentrado porque quiere sus malditos juguetes. Cuando terminemos, correré con él hasta la hielera y la abriré para que pueda agarrar un juguete.

Lo que no hago es correr con una PELOTA en la mano o un juguete para tirar. Cuando era joven, claro. Pero ahora sabe que estamos trabajando juntos y que en algún momento habrá una recompensa».

2) Berrinche

No todos los programas de refuerzo se establecen intencionalmente, pero aún así aumentan la probabilidad de ciertas conductas. Digamos que un niño hace un berrinche durante la cena porque no quiere comer verduras. La mayoría de las veces, sus padres esperan que pase la rabieta y no se levantan de la mesa hasta que el niño come su comida. Pero de vez en cuando, cuando los padres están cansados ​​o frustrados, “se rinden”. Al niño le quitan el plato de comida y el niño no tiene que comer verduras.

Esto no sucede cada vez que el niño tiene una rabieta, pero sucede lo suficiente como para que el niño aprenda que hacer una rabieta a veces funciona. Con el tiempo, si este comportamiento se refuerza ocasionalmente, seguirán utilizando la rabieta como una forma viable de dejar de comer verduras.

3) Ventas, presentaciones u obtención de un papel

Levantar el teléfono para una llamada en frío puede resultar desalentador, a menos que lo vea como un programa de refuerzo de proporción variable. No todas las llamadas que hagas terminarán en un trato. De hecho, la mayoría de las llamadas terminarán en un rechazo. Pero de vez en cuando, ya sea una de cada 100 llamadas o incluso cada 500 llamadas, cierras una venta o recibes una aceptación.

El mismo proceso funciona para un autor que intenta presentar su libro a un editor, un actor que intenta conseguir un papel o un emprendedor que busca financiación. Superar todos los rechazos se siente como estar cada vez más cerca de ganar. Cuando los representantes de ventas, actores u otras personas que tienen que presentar sus productos y servicios todos los días tratan esta tarea como un juego de números, es probable que se sientan más motivados a seguir adelante, incluso cuando enfrentan 10, 20 o 50 rechazos en una semana. fila.

¿Funciona el refuerzo de relación variable?

El refuerzo de proporción variable es un programa de refuerzo parcial, lo que significa que el refuerzo no se distribuye cada vez que la persona realiza la conducta. El cronograma del refuerzo y el refuerzo mismo afectan la probabilidad de que el sujeto realice o no la conducta.

Si una persona supiera que ganaría el premio mayor cada vez que jugara en las máquinas tragamonedas, todas las personas en el mundo estarían en el casino ganando millones de dólares. Pero no es así como funcionan los casinos. La gente se alejará de las máquinas tragamonedas perdiendo cientos o miles de dólares a la vez, pero aun así es posible que vuelvan a jugar al día siguiente porque creen que ganarán el premio mayor.

Este programa de refuerzo conduce a una tasa de respuesta constante. En otras palabras, funciona. Una persona puede alejarse de la máquina tragamonedas después de ganar el premio mayor y decir que no volverá, pero después de un período de tiempo, volverá.

Otros programas de refuerzo (ejemplos)

Un refuerzo de proporción variable es sólo una opción para las personas que desean aumentar la probabilidad del comportamiento de otra persona (o el suyo propio). También se encuentran disponibles programas de relación fija, intervalo fijo e intervalo variable.

El refuerzo de proporción fija ocurre cuando se otorga una recompensa después de un número fijo de respuestas. ¿Tiene alguna tarjeta de recompensa de empresas locales? ¿Después de nueve cafés, te regalan uno? Después de registrarte 10 veces en un rocódromo, ¿te dan tiza gratis? Este es un ejemplo de refuerzo de relación fija.

El refuerzo de intervalo fijo ocurre cuando se distribuye una recompensa si la conducta se realiza dentro de un intervalo fijo. Las tablas de tareas son un gran ejemplo de esto. Digamos que tienes una lista de tareas para hacer el lunes, martes, miércoles, etc. No tienes que hacer tu cama a las 7 am todos los lunes, pero si haces tu cama antes del final del día lunes, obtendrás una recompensa.

El refuerzo de intervalo variable ocurre cuando se distribuye una recompensa si la conducta se realiza dentro de intervalos variables. Un gran ejemplo de esto es un comprador secreto. El comportamiento es un buen servicio o varias partes del ciclo de ventas. Quizás el comprador secreto venga dos veces en un año. Tal vez vengan a principios de año y luego dos meses después sólo para hacer seguro La tienda está haciendo un buen trabajo. Si se realiza la conducta, entonces se distribuye la recompensa.

Refuerzo continuo

Todos los programas de refuerzo anteriores son programas de refuerzo parciales. La alternativa a esto es un programa de refuerzo continuo. Cada vez que se realiza una conducta, se distribuye una recompensa. Aunque esta es sin duda la mejor manera de garantizar que las conductas se realicen después del condicionamiento, no siempre es factible. Compartir una recompensa cada vez que tu perro se sienta, especialmente si esa recompensa es una golosina o un juguete, tendrá más efectos negativos que positivos.

Cómo condicionarse con refuerzo de proporción variable

Acondicionarse con refuerzo de proporción variable o de intervalo variable es bastante difícil. ¡Se supone que no debes saber el tiempo en el que se debe completar el comportamiento! Pero hay algunas formas en las que puedes probar esta forma de condicionamiento.

Cómprate una máquina tragamonedas.

No, no una de esas máquinas tragamonedas de Las Vegas que ocupan una habitación entera. Hay pequeñas máquinas tragamonedas disponibles en línea que la gente coloca en sus bares como decoración y diversión. Guárdelo en un lugar al lado de donde realiza un comportamiento que desea condicionarse a realizar y juegue con la máquina cada vez que realice ese comportamiento. Cada vez que «ganes», ¡date una gran recompensa!

¡Llena un contenedor!

Esto es un poco creativo pero quédate conmigo. Tome una alcancía, un frasco opaco u otro recipiente que pueda llenar con elementos cada vez que realice su comportamiento. Una vez que ese frasco esté completamente lleno, recompénsate. Puede tal vez Tenga una idea de cuándo está alcanzando su recompensa, pero con un frasco opaco lo suficientemente grande, ¡no sabrá exactamente cuántas veces debe realizar el comportamiento para obtener la recompensa!

Reclute a un compañero responsable.

Deje que su amigo o colega determine las distintas proporciones en las que obtendrá una recompensa. Cuéntale a tu amigo sobre el comportamiento que deseas condicionarte a realizar. Si te pillan haciéndolo “varias veces”, diles que te ofrezcan una recompensa. Asegúrese de que comprendan el refuerzo de proporción variable para que sepan que no deben darle una recompensa. cada vez. Por ejemplo, pídele a un amigo que te anime de vez en cuando cuando te vea beber agua. O dales unos cuantos dólares y dile a tu amigo que te los devuelva después de “unos días” de no fumar. Si quieres recuperar esa recompensa, ¡te asegurarás de no fumar cerca de tu amigo!