En artikel om positive og negative diskriminative stimuli, eller hvorfor man ikke bør blande klikkertræning og træning med korrektion. “The poisoned cue”…
Tekst: Karen Pryor
En tillært stimulus som kommer forud for en operant adfærd, kaldes af læringspsykologerne for en `diskriminativ stimulus`. Læringspsykologerne skelner ikke, så vidt jeg ved, mellem en diskriminativ stimulus som er lært ved hjælp af positiv forstærkning og en som er lært ved hjælp af negativ forstærkning. I praksis er der derimod en klar forskel. I klikkertræning (operant betingning med en betinget forstærker) bliver adfærden først udviklet som en operant adfærd frit tilbudt i forventning om positiv forstærkning. Den diskriminative stimulus (f.eks. kommandoen) bliver derefter parret med adfærden for at kunne fungere som en indikator på at den bestemte adfærd vil blive efterfulgt af en positiv forstærker. Hver diskriminative stimulus signalerer muligheden for at tjene en forstærker for en bestemt adfærd eller samling af adfærd.
Denne positivt indlærte diskriminative stimulus “åbner altid døren” til positiv forstærkning. Hvis adfærden ikke forekommer, er det eneste resultatet at forstærkeren udebliver. Når adfærden forekommer, er forstærkeren garanteret. (Klikkertrænere kalder ofte denne type kommando for et “signal” for at skelne det fra den traditionelle kommando).
Så snart dyret forstår hvad en givet kommando betyder, bliver kommandoen, eller den diskriminative stimulusen, i sig selv en betinget forstærker, akkurat som klikket. Altså kan man bruge kommandoen som en forstærker for adfærd som forekommer i det kommandoen bliver givet. Man kan for eksempel bruge den veletablerede positive kommando for en bestemt adfærd til at forme (shape) en anden adfærd. Det virker også sandsynligt at den behagelige følelsesmæssige respons som vi ved associeres med klikket, også falder sammen med præsentationen af disse positivt indlærte kommandoer.
Adfærd som er blevet trænet med korrektion, er også styret af diskriminative stimuli som indikerer når en bestemt adfærd skal forekomme. Men disse diskriminative stimuli kan eller kan ikke føre til positiv forsterkning. Hvis hunden ikke udfører adfærden på kommando eller udfører den forkert, tilføres positiv straf (almindeligvis kaldet “korrektion”). Den negative diskriminative stimulus (kommandoen) er nu en betinget negativ forstærker og signalerer muligheden for at undgå straf.
Selv når adfærden tidligere blev trænet udelukkende med positiv forstærkning, vil stimulusen øjeblikkelig miste sin værdi som en positiv forstærker dersom man klikker for korrekt adfærd efter en diskriminativ stimulus, men også tilfører aversiver (korrektioner som ryk i linen, skældud etc.) for ukorrekt adfærd efter samme stimulus. Det er i bedste fald tvetydigt i forhold til forstærkning. Det er ikke et klik. Den diskriminative stimulusen vil ikke længere automatisk udløse de positive følelser associeret med betingede positive forstærkere. Kommandoerne kan ikke længere bruges forudsigeligt i en kæde til at forstærke forrige adfærd.
Selv om primære forstærkere, som ros, leg og godbidder tilføres i overflod under eller efter træning eller konkurrence, vil de diskriminative stimuli, kommandoerne, være lige så meget trusler som løfter om forstærkere. Adfærd har da en tendens til at bryde sammen, interessant nok både før og efter disse tvetydige kommandoer. Før; fordi adfærden foran kommandoen vil ekstingveres på grund af manglende positiv forstærkning. I stedet vil udførelse af adfærden “belønnes” med en trussel. Og efter; fordi adfærd som kan blive straffet, har en tendens til at undgås.
Skiftet bliver tydeligt hos hunden som skifter fra lydhør iver til modvilje, ofte med synlige manifestationer af stress. Selv om korrekt respons efter en bestemt diskriminativ stimulus fremdeles følges af forstærkning, har du gjort denne bestemte diskriminative stimulus tvetydig i forhold til resultatet dersom ukorrekt respons nu følges af straf.
Den diskriminative stimulus er ikke længere “tryg”. Du har ødelagt din kommando…