fbpx

Omvänt lockande, straff eller inte?

Idag kickar vi igång ännu en ny utmaning i vår aktiveringsgrupp på facebook, den här gången är temat stadga. Stadga innebär till exempel att hunden kan hålla en position utan att hoppa runt, stanna på en viss plats, eller vänta på belöningssignal innan den tar en utplacerad externbelöning. Ett enkelt, effektivt och – jag avslöjar min ståndpunkt redan här – roligt sätt att lära hunden just stadga är det som kallas omvänt lockande.

I omvänt lockande leker vi med hundens impulser vs förmåga att tolka, förstå och välja andra strategier när impulserna inte ger önskat resultat. Jag håller en godbit i handen, hunden ser att den är där och vill ha den – impulsen är ta! Men när hon försöker ta stängs handen: att följa impulsen gör att godisen försvinner, istället för att den landar i munnen. En annan strategi skulle alltså löna sig mer än att bara följa den självklara impulsen…

När hunden förstår systemet blir omvänt lockande snabbt ett helt kommunikationssystem, vi kan berätta för hunden mer eller mindre genast att det här beteendet är ett där uthållighet lönar sig genom att hålla fram en öppen hand. Vi kan berätta att poängen är att stanna där du är genom att “retas” med belöningar en bit bort. Vi kan, om vi vill, göra det till ett system för nyinlärning genom varmt/kallt med belöningarna.

Enkelt. Effektivt. Och väldigt, väldigt roligt! Hundarna får dryga sig med en “mig lurar du minsann inte!”-min och skulle någon gång frestelsen bli för stor är en reset med lägre kriterier och snabb belöning bara ett ögonblick bort. Så vad är problemet?

Vill vi använda straff!?

Straff är ett ord vars tekniska innebörd i det här sammanhanget kanske inte alltid är helt tydlig. Det är lätt att tänka att “straffa hunden” betyder saker som att hota, skrämma eller rentav bli fysiskt våldsam, eller hur? Men det är inte vad som avses: straff är en konsekvens som följer på ett beteende, och därigenom minskar sannolikheten för det beteendets framtida upprepande. Alltså

  1. Jag gjorde något
  2. Sedan hände något som jag inte gillade
  3. Jag vill inte att det ska hända igen
  4. Jag vill inte göra om beteendet i punkt 1

Konsekvensen, det jag inte gillade att det hände, har straffat mitt beteende. Jag blir mindre benägen att upprepa det beteendet (åtminstone i den situationen), eftersom jag inte gillade konsekvensen det fick.

Och för att krångla till det ytterligare finns det två typer av straff (och förstärkare/belöningar för den delen): straff kan vara negativa eller positiva. Positiv/negativ i det här sammanhanget betyder inte bra/dåligt! Det betyder att något tillkommer eller försvinner, det är allt. Något positivt läggs till, något negativt tas bort. Så ett negativt straff innebär att jag blev straffad genom att något försvann, ett positivt straff att jag blev straffad genom att något tillkom. Exempel:

  • Negativt straff: När jag kliar Totoro slutar han dricka vatten. Jag vill att han dricker vatten, han drack vatten, men mitt beteende att klia honom fick vattendrickandet att upphöra. Något jag tyckte om försvann, jag vill inte att det ska hända igen, alltså blir sannolikheten att jag ska klia honom mindre i framtiden. Mitt beteende har utsatts för ett negativt straff.
  • Positivt straff: När jag kliar Totoro kliar han tillbaka genom att gnaga på min hand. Det gör ont, jag får blåmärken, jag gillar inte att ha ont. Mitt beteende att klia honom ledde till att jag fick blåmärken, smärta tillkom, jag vill inte att det ska hända igen, alltså blir sannolikheten att jag ska klia honom mindre i framtiden. Mitt beteende har utsatts för ett positivt straff.

I båda fallen har mitt beteende att klia Totoro utsatts för straff, i ena fallet genom positivt straff (det tillkom obehag) och i andra fallet genom negativt straff (något trevligt försvann). Straffet gör absolut ingenting med beteendet som redan hänt, saker kan inte göras ogjort, men det påverkar sannolikheten för mina framtida beteenden.

Så vad händer när vi använder omvänt lockande med våra hundar?

  1. Hunden försöker ta godis ur en öppen hand
  2. Handen stängs

Något bra (godis) försvann (handen stängdes) som konsekvens av hundens beteende (försökte ta). Beteendet att försöka ta godisen har alltså utsatts för negativt straff.

Är Hund Helt Enkelt för träning med straff!?

Varför tror ni annars jag går så fint i koppel?

Verktyg eller regler

Metoder, tekniker, analyser, regler med mera är – extremt viktiga och värdefulla – verktyg. De ger oss möjligheter att observera och analysera vad som händer i träning (och i livet i stort) betydligt mer noggrant och kraftfullt än vad vi klarar av utan dem. Det är otroligt viktigt att känna till och förstå dem, och att kontinuerligt jobba med att utveckla våra färdigheter att använda dem effektivt och korrekt. Alla tjänar på att behärska våra verktyg effektivt.

Ett vanligt problem med alla verktyg är dock… Tja, som bekant ser det mesta ut som en spik om man håller i en hammare. Det är lätt att låta verktygen ta över och bli hela den verklighet vi har tillgänglig. Ett sätt att motverka det är att se till att ha en välfylld verktygslåda, ju fler verktyg vi har tillgång till desto mindre risk att vi börjar använda de vi har där de inte gör nytta. Men ett annat, minst lika viktigt, sätt är att förstå och acceptera verktygs begränsningar.

Vi har pratat om vad straff är, om vi straffar när vi använder omvänt lockande, och kommit fram till att ja, det innehåller solklart straff. Vi är belöningsbaserade tränare, så straff = dåligt!

Glasklart!

Nja.

Kvadranterna – uppdelningen i positivt/negativt och straff/förstärkning – är ett verktyg som delar upp allt i antingen eller. Men dessutom också. Något är ett straff eller en förstärkare, något är positivt eller negativt. Men det sitter också ihop med sin exakta motsats… Motsatsen till negativt straff (något trevligt försvinner) är positiv förstärkning (något trevligt tillkommer), motsatsen till positivt straff (något otrevligt tillkommer) är negativ förstärkning (något otrevligt försvinner). Det är ett verktyg för att analysera vilka konsekvenser som har vilken påverkan på ett beteendes sannolikhet att upprepas i framtiden.

När hunden sätter sig kommer en tillförd köttbulle att öka sannolikheten för att hunden sätter sig igen i framtiden (beteendet blev positivt förstärkt). Vad betyder det att den konsekvensen “sitter ihop” med sin motsats!?

  • Köttbulle = positiv (tillförd) förstärkare (något trevligt)
  • Motsatsen till positiv förstärkare = negativt (borta) straff (något obehagligt)
  • Negativt straff = frånvaron av köttbulle?

Hm.

Så länge hunden inte får köttbullen in i munnen är alla beteenden straffade? Och efter den ätit upp köttbullen straffas alla beteenden igen?

Nja. Inte riktigt. Men också… Ja, typ, faktiskt. Frånvaron av förstärkare är inte straff, alltså att ingen köttbulle existerar är inte straffande för beteendet att stå. Beteendet att stå kommer inte att minska i sannolikhet för att det inte förekommer köttbullar i situationen. Men. Förekomsten av en köttbulle hunden vill ha men inte kan få genom att stå, men kan få genom att sitta? Japp. Det straffar beteendet att stå. För att? Sannolikheten att hunden står i situationen där det finns köttbullar minskar. Beteendet minskar i sannolikhet är definitionen av att beteendet blivit straffat.

Om vi vill använda oss av det här verktyget för att analysera våra träningsupplägg (vilket jag starkt rekommenderar att vi gör om än inte uteslutande), måste vi acceptera att vi straffar beteenden. Det är en del av själva verktyget. När jag belönar (förstärker) ett beteende i ett urval av andra beteenden? Då straffar jag också de andra beteendena.

Straff och belöningar handlar inte om imperiet vs. rebellerna, om ont ställt mot gott. Det handlar om tekniska analyser av konsekvensers påverkan.

Så vi är för straff?

Nej.

Det är stor skillnad på att använda sig av straff som en aktiv påverkan, alltså det vi aktivt delar ut för att tillhandahålla påverkande konsekvenser, och på att acceptera att straff i teknisk betydelse är en del av allt som händer. Jämför skillnaden mellan att lägga en macka på bordskanten i syfte att locka hunden att försöka ta den så vi får en chans att tillföra straff för att minska sannolikheten att beteendet upprepas, mot att lägga en macka på bordskanten och aktivt belöna (förstärka) alla beteenden bort från bordet. Det är inte samma sak bara för att vi kan analysera båda uppläggen tekniskt och komma fram till att de innehåller straff.

Så låt oss återvända till det omvända lockandet. Hunden försöker ta, jag stänger handen. Det här är ett straff! Det är solklart! Jag stänger – aktivt – handen och tillhandahåller ett negativt straff för beteendet att försöka ta godisen! Japp, det stämmer. Och när hunden inte tar öppnar jag – aktivt – handen och tillhandahåller en positiv förstärkare (belöning) för att backa undan… Omvänt lockande är ett utmärkt exempel på hur konsekvenserna sitter ihop, vi kan inte ha det ena utan det andra.

Spelar det någon roll om vi fick den här bilden genom att straffa alla försök att kliva upp, eller genom att belöna att ligga kvar?
Ja. Det spelar stor roll! Eller hur?

Betyder det då att omvänt lockande är perfekt och aldrig är problematiskt att använda? Nope!

Straff i betydelsen vi gått igenom ovan är en sak, det är en teknisk definition av observerbara effekter. Men straff i dagligt tal handlar mycket mer om obehag, och obehag är absolut inte ok. Självklara obehag är tex att vi grälar på hunden, rycker i kopplet eller daskar till den – saker jag tror vi alla här är eniga om att ta avstånd från. Mindre självklara obehag är ofta de sociala bitarna, visa besvikelse, ta avstånd (rentav timeout) och liknande. Ofta minst lika obehagligt som att få en smäll! Och så har vi besvikelse och misslyckande, den största faran med just omvänt lockande.

Det är faktiskt obehagskonsekvenser som bör tas på större allvar generellt i träning, att hunden blir besviken över att en förväntat belöning uteblev eller rentav känner sig misslyckad när den inte lyckas lösa uppgiften är förutom just väldigt obehagligt för hunden också en vanlig orsak till att träningsresultaten uteblir. Överlag handlar det generellt om att vi gör det för svårt, vi är för “snåla” med belöningarna. (Eller, lite mer tekniskt, våra kriteriesteg är för stora.)

Om vi tittar på ett vanligt klickerpass kan det vara nyttigt att komma ihåg att motsatsen till klick är tystnad. Alltså: när du inte klickar straffar du… Sorry! (Not sorry.) Medan i omvänt lockande, när godisen inte kommer närmare (symboliskt eller fysiskt) straffar du. Nyckeln är att sträva efter rätt mål.

När jag kör ett klickerpass är jag aktivt ute efter att få klicka, jag vill klicka, min tumme vibrerar av en önskan att nu, nu, nuuuuuu vill jag trycka på knappen! Förutom att det är roligare – och effektivare – än att stå där och värdera om något verkligen var bra nog att bemöda sig att klicka för, gör det mig också till en bättre tränare rent praktiskt. Mitt fokus på att få klicka förbättrar min reaktionsförmåga och håller min observationsförmåga på topp. Jag är snabbare och exaktare. Hunden har roligt, upplever sig superduktig och smart (som den ju är!), och lär sig massor.

I omvänt lockande är alltså mitt mål att kunna hålla handen öppen och ge hunden godis. Inte att stänga den så inte hunden kan ta. Att stänga handen är som frånvaron av klick – det är inte därför vi är här. (Men det är en del av upplägget.)

Är det verkligen så enkelt? Ja. Och, givetvis, nej. Eller snarare, även saker vi föreställer oss är klockrent uppenbara och enkla är nog lite mer komplicerade än vi ofta tror.

I labbet eller i världen

En viktig sista sak att nämna är att verktygen är jättebra – i isolation. Ett beteende, en konsekvens (eller ett konsekvenspar då). Men det är ju inte så verkligheten ser ut…

I situationen där jag kliar Totoro och blir straffad för det genom att han slutar dricka vatten och börjar tugga på mig är det ju inte allt som händer. Vi blir båda glada (det är en lek), får en oxytocinkick (det är en prosocial ritual), blir skrattade åt av andra som ser oss (är det straff eller förstärkning?), när han biter på min hand kommer han också åt det där irriterande myggbettet på lillfingret (skönt), jag skrattar (han tycker det är roligt), han trampar på min fot så jag ramlar baklänges (det bästa han vet är att hoppa på mig när jag ligger ner), och till slut kastar Åsa till honom några godisar så hon inte ska förlora sin partner. Är beteendet att klia honom egentligen straffat eller förstärkt? Vem vet? Har jag fått med alla konsekvenser här? Har jag analyserat samtliga korrekt i vilken typ de är? Garanterat inte.

Det här är hur beteende – konsekvens egentligen ser ut. Vi lever våra liv i kaos, vare sig det är en vardagssituation eller ett planerat träningsupplägg. Det är nyttigt (extremt nyttigt!) att tänka på konsekvenser och -typer, att klarsynt försöka få en överblick över vad vi försöker påverka och hur, och att vara öppen för att vi missbedömt saker. Men det är meningslöst att faktiskt titta på kaos och försöka kalla det ordning – det är nödvändigt att komma ihåg att när vi bryter ut en del och tittar närmare på den så är den inte egentligen isolerad. Utanför vår lilla analys är det tusen saker till som påverkar. Det är verkligheten.

Till slut

Det här låter ju helt hopplöst! Vi kan inte undvika (vissa typer av) straff, vi kan inte skapa ordning i kaos, och hur vi än gör kan det alltid ändå bli fel! Lika bra att ge upp det här och börja samla frimärken istället…

Det var verkligen inte det jag var ute efter! Så låt mig avsluta med att visa på ett verktyg som alltid är tillämpligt och inte kan leda er fel: känsloupplevelse. Känslor är det viktigaste vi har och det vi alltid måste sätta först. Vi och hundarna delar känslor/förmåga att känna, deras känslor är lika viktiga och djupa som våra. Sikta på glädje! Alltid.

Ett skämt är roligt om båda skrattar, en lek är rolig om båda vill vara med.

Vi har roligt för att Totoro tycker det är spännande och kul att försöka balansera på en smal bom. Inte för att jag tycker det skulle vara häftigt att visa upp på bild att min stora klump kan balansera.

Du kanske också gillar…

Förebereda inför tävling

Förebereda inför tävling

Om knappt en vecka debuterar vi i både HtM och Freestyle, Midori och jag. För en gångs skull har jag faktiskt haft en...

Hantera tävlingsnerver

Hantera tävlingsnerver

Under dagens banvandring på vår öppna rallyträning kommenterade en av deltagarna "Så skönt att se att det inte bara är...

Lär du hunden vakta sina grejer?

Lär du hunden vakta sina grejer?

Resursförsvar kallar vi det när hunden försvarar sådant som är viktigt för den. Det är något som är helt naturligt,...

0 kommentarer

Trackbacks/Pingbacks

  1. Omvänt lockande i praktiken ⋆ Hund Helt Enkelt - […] förra veckan skrev Ulrika ett inlägg om omvänt lockande ur ett härligt teoretiskt och nördigt perspektiv – superintressant tycker…

Skicka en kommentar

Din e-postadress kommer inte publiceras.