Chiudi questo lettore video
Gli schemi di rinforzo svolgono un ruolo importante nel condizionamento operante , che è un processo di apprendimento in cui nuovi comportamenti vengono acquisiti e modificati tramite la loro associazione con conseguenze. Rinforzare un comportamento aumenta la probabilità che si verifichi di nuovo in futuro, mentre punire un comportamento diminuisce la probabilità che venga ripetuto.
Perché i programmi di rinforzo sono così importanti? Quando e quanto spesso rinforziamo un comportamento può avere un impatto drammatico sulla forza e la velocità della risposta.
In questo articolo si analizza cosa sono i programmi di rinforzo, i diversi programmi che possono essere utilizzati e quale sia il migliore a seconda degli obiettivi di apprendimento.
Indice
Cosa sono i programmi di rinforzo?
I programmi di rinforzo sono regole che stabiliscono quali istanze di comportamento saranno rinforzate. In alcuni casi, un comportamento potrebbe essere rinforzato ogni volta che si verifica. A volte, un comportamento potrebbe non essere rinforzato affatto.
Sia il rinforzo positivo che quello negativo possono essere usati come parte del condizionamento operante. In entrambi i casi, l’obiettivo del rinforzo è rafforzare un comportamento in modo che probabilmente si verifichi di nuovo.
I programmi di rinforzo si verificano sia in situazioni di apprendimento naturali che in situazioni di addestramento più strutturate. In contesti reali, i comportamenti probabilmente non saranno rinforzati ogni volta che si verificano. In situazioni in cui si cerca intenzionalmente di rinforzare un’azione specifica (come a scuola, nello sport o nell’addestramento degli animali), si seguirà un programma di rinforzo specifico.
Alcuni programmi sono più adatti a certi tipi di situazioni di addestramento. In alcuni casi, l’addestramento potrebbe richiedere un programma e poi passare a un altro una volta che il comportamento desiderato è stato insegnato. Le due forme fondamentali di programmi di rinforzo sono denominate rinforzo continuo e rinforzo parziale.
Programmi continui di rinforzo
Nel rinforzo continuo, il comportamento desiderato viene rinforzato ogni volta che si verifica. Questo schema è più efficace nelle fasi iniziali dell’apprendimento per creare una forte associazione tra comportamento e risposta.
Immagina, ad esempio, di provare a insegnare a un cane a stringerti la mano. Durante le fasi iniziali dell’apprendimento, dovresti attenerti a un programma di rinforzo continuo per insegnare e stabilire il comportamento. Questo potrebbe comportare afferrare la zampa del cane, stringerla, dire “stringi” e quindi offrire una ricompensa ogni volta che esegui questi passaggi. Alla fine, il cane inizierà a eseguire l’azione da solo.
I programmi di rinforzo continuo sono più efficaci quando si cerca di insegnare un nuovo comportamento. Questi programmi denotano un modello in cui ogni risposta definita in modo ristretto è seguita da una conseguenza definita in modo ristretto.
Tabelle parziali di rinforzo
Una volta che la risposta è saldamente stabilita, un programma di rinforzo continuo viene solitamente cambiato in un programma di rinforzo parziale. Nel rinforzo parziale (o intermittente), la risposta viene rinforzata solo una parte del tempo. I comportamenti appresi vengono acquisiti più lentamente con il rinforzo parziale, ma la risposta è più resistente all’estinzione .
Pensa all’esempio precedente in cui stavi addestrando un cane a scuotersi. Mentre inizialmente hai utilizzato un rinforzo continuo, rinforzare il comportamento ogni volta, molto tempo dopo che il cane ha imparato il trucco, è semplicemente irrealistico. Col tempo, passeresti a un programma parziale per fornire ulteriore rinforzo una volta che il comportamento è stato stabilito o dopo che è trascorso un tempo considerevole.
Ci sono quattro programmi di rinforzo parziale. Due sono programmi di rapporto, che sono programmi basati su quante risposte si sono verificate. Gli altri due sono programmi di intervallo o programmi basati su quanto tempo è trascorso.
Questi quattro schemi di rinforzo sono talvolta denominati FR, VR, FI e VI, che stanno per rapporto fisso, rapporto variabile, intervallo fisso e intervallo variabile.
Orari a rapporto fisso
I programmi a rapporto fisso sono quelli in cui una risposta viene rinforzata solo dopo un numero specificato di risposte. Questo programma produce un tasso di risposta elevato e costante con solo una breve pausa dopo la somministrazione del rinforzo. Un esempio di programma a rapporto fisso sarebbe la somministrazione di una pallina di cibo a un ratto dopo che ha premuto una barra cinque volte.
Programmi a rapporto variabile
I programmi a rapporto variabile si verificano quando una risposta viene rinforzata dopo un numero imprevedibile di risposte. Questo programma crea un tasso di risposta elevato e costante. I giochi d’azzardo e la lotteria sono buoni esempi di una ricompensa basata su un programma a rapporto variabile. In un ambiente di laboratorio, questo potrebbe comportare la consegna di pellet di cibo a un ratto dopo una pressione della barra, di nuovo dopo quattro pressioni della barra e poi di nuovo dopo due pressioni della barra.
Programmi a intervalli fissi
I programmi a intervalli fissi sono quelli in cui la prima risposta viene premiata solo dopo che è trascorso un determinato lasso di tempo. Questo programma determina un’elevata quantità di risposte verso la fine dell’intervallo, ma una risposta più lenta subito dopo la somministrazione del rinforzo. Un esempio di ciò in un ambiente di laboratorio sarebbe il rinforzo di un ratto con un pellet da laboratorio per la prima pressione della barra dopo che è trascorso un intervallo di 30 secondi.
Programmi a intervalli variabili
Le pianificazioni a intervallo variabile si verificano quando una risposta viene premiata dopo che è trascorso un lasso di tempo imprevedibile. Questa pianificazione produce un tasso di risposta lento e costante.
Un esempio di ciò potrebbe essere la somministrazione di un pellet di cibo a un ratto dopo la prima pressione della barra, a un intervallo di un minuto; un secondo pellet per la prima risposta, a un intervallo di cinque minuti; e un terzo pellet per la prima risposta, a un intervallo di tre minuti.
Programma parziale | Tempistica del rinforzo | Tasso di risposta |
Rapporto fisso (FR) | Dopo un numero specificato di risposte | Alto, costante |
Rapporto variabile (VR) | Dopo un numero imprevedibile di risposte | Alto, costante |
Intervallo fisso (FI) | Dopo un periodo di tempo specificato | Elevato verso la fine dell’intervallo, ma più lento subito dopo la somministrazione del rinforzo |
Variabile-Intervallo (VI) | Dopo un lasso di tempo imprevedibile | Lento, costante |
Programmi di rinforzo e di estinzione
Una volta che un rinforzo viene interrotto, la risposta inizia a declinare. Questo è definito estinzione, o la durata del tempo in cui la risposta continua quando il rinforzo non viene più applicato. In genere, i programmi fissi di rinforzo sono più inclini all’estinzione mentre i programmi variabili sono più resistenti.
L’estinzione può causare effetti collaterali indesiderati. Uno è chiamato response burst, ovvero quando la risposta aumenta temporaneamente in quantità, magnitudine o durata prima di estinguersi. Un altro è la variabilità della risposta, che spesso include lo sviluppo di altri comportamenti problematici per ottenere la stessa risposta.
Esempi di tabelle di rinforzo
I programmi di rinforzo possono essere applicati in contesti diversi. Possono essere utilizzati nell’istruzione, ad esempio, come rinforzando gli studenti dopo che un certo numero di compiti sono stati completati o dopo che è trascorso un certo periodo di tempo senza problemi comportamentali.
Un esempio di utilizzo di un programma di rinforzi in uno scenario genitoriale è quando si insegna a un bambino a usare il vasino. Si potrebbe iniziare dando al bambino un pezzo di caramella ogni volta che usa il vasino (rapporto fisso). Quindi, si potrebbe passare a fornire rinforzi solo dopo aver usato il vasino per diversi giorni di fila (intervallo fisso o intervallo variabile).
I programmi di rinforzo possono essere utilizzati anche nell’analisi comportamentale applicata o ABA. In questo caso, i rinforzi vengono utilizzati per migliorare un certo tipo di comportamento. Ad esempio, la ricerca ha scoperto che questi programmi possono essere utili per aiutare le persone con difficoltà intellettive o di sviluppo a migliorare i comportamenti comunicativi.
Utilizzo della pianificazione appropriata
Decidere quando rinforzare un comportamento può dipendere da diversi fattori. Nei casi in cui si sta specificatamente cercando di insegnare un nuovo comportamento, un programma continuo è spesso una buona scelta. Una volta appreso il comportamento, passare a un programma parziale è spesso preferibile.
Nella vita quotidiana, i programmi parziali di rinforzo si verificano molto più frequentemente di quelli continui. Ad esempio, immagina di ricevere una ricompensa ogni volta che ti presenti al lavoro in orario. Nel tempo, invece di essere una ricompensa un rinforzo positivo, la negazione della ricompensa potrebbe essere considerata una punizione negativa.
Invece, ricompense come queste vengono solitamente distribuite secondo un programma di rinforzo parziale molto meno prevedibile. Non solo sono molto più realistiche, ma tendono anche a produrre tassi di risposta più elevati, pur essendo meno suscettibili all’estinzione.
I programmi parziali riducono il rischio di sazietà una volta che un comportamento è stato stabilito. Se una ricompensa viene data senza fine, il soggetto potrebbe smettere di eseguire il comportamento se la ricompensa non è più desiderata o necessaria.
Ad esempio, immagina di provare a insegnare a un cane a sedersi. Se usi il cibo come ricompensa ogni volta, il cane potrebbe smettere di eseguire l’azione una volta sazio. In tali casi, qualcosa come la lode o l’attenzione potrebbe essere più efficace nel rinforzare un comportamento già stabilito.
Una parola da Verywell
Il condizionamento operante può essere un potente strumento di apprendimento. I programmi di rinforzo utilizzati durante il processo di addestramento e mantenimento possono avere un’influenza importante sulla rapidità di acquisizione di un comportamento, sulla forza della risposta e sulla frequenza con cui il comportamento viene mostrato.
Per determinare quale programma è preferibile, bisogna considerare diversi aspetti della situazione, tra cui il tipo di comportamento che viene insegnato e il tipo di risposta desiderata.