Historia szkolenia z klikerem
Metoda klikerowa została opracowana przez trenerów pracujących z delfinami podczas przygotowań do występów w oceanariach. Ze względu na dystans dzielący trenera, który stoi na brzegu, i zwierzę swobodnie pływające w basenie trudno wdrożyć jakiekolwiek bodźce awersyjne. Okazało się jednak, że dzięki użyciu jedynie pozytywnych wzmocnień udaje się nie tylko zachęcić te zwierzęta do pracy z człowiekiem, lecz także wyeliminować zachowania, które są niepożądane.
Czym jest kliker?
Kliker jest mieszczącym się w dłoni urządzeniem, które po naciśnięciu wydaje charakterystyczny odgłos „klik, klik”, służący jako marker zachowania, które chcemy nagrodzić podczas szkolenia. Metoda klikerowa ściśle nawiązuje do procesu uczenia się zwierząt w naturze – niezależnie od gatunku, w tym człowieka. W niniejszym artykule mowa będzie przede wszystkim o psach. Należy jednak pamiętać, że opisaną metodę można wykorzystać także do szkolenia innych gatunków zwierząt, np. kota lub królika.
Jak uczą się psy?
Psy, podobnie jak ludzie i wszystkie żywe istoty, uczą się dzięki skojarzeniom. Budulcem naszej rzeczywistości jest łańcuch przyczynowo-skutkowy, zgodnie z którym jedne zdarzenia zapowiadają kolejne. Zwierzęta domowe są świetnymi obserwatorami i bardzo łatwo przychodzi im uczenie się takich związków. Szybko uczą się przewidywać, kiedy zamierzamy je wziąć na spacer, nakarmić czy też zostawić same w domu. Zdradza nas nasze zachowanie tuż przed wykonaniem prostych czynności. Psy doskonale wiedzą, kiedy wychodzimy do pracy na dziewięć godzin, a kiedy idziemy tylko po bułki do sklepu po drugiej stronie ulicy. Bacznie nas obserwują i wiedzą, że przed wyjściem na wiele godzin właścicielka szykuje się w łazience i robi kompletny makijaż, ubiera się, psika perfumami, a kiedy wychodzi na krótko, po prostu wkłada buty i kurtkę oraz szuka kluczy. W naturze uczenie się takich zależności zapewnia przetrwanie i pozwala uniknąć nieprzyjemnych doznań.
Warunkowanie klasyczne
Uczenie się skojarzeń przebiega na dwóch płaszczyznach. Pierwszą jest warunkowanie klasyczne, podczas którego dochodzi do nawiązania skojarzenia pomiędzy dwoma bodźcami. Na przykład wkładanie butów oznacza spacer, a dźwięk otwieranej lodówki zwiastuje pojawienie się jedzenia. Zjawisko to tłumaczy słynny eksperyment Pawłowa. Naukowiec zauważył, że jeden z mierzonych przez niego parametrów – poziom ślinienia u psów – wyraźnie wzrasta jeszcze przed pojawieniem się jedzenia, na widok samego sygnału zapowiadającego karmienie, np. miski lub osoby karmiącej, bez udziału samego jedzenia. Bodziec, który początkowo nie wpływał na zachowanie, zaczyna je prowokować. Taką reakcję nazwano odruchem bezwarunkowym. Idąc dalej tym tropem, Pawłow zaprojektował eksperyment, w którym podczas podawania jedzenia dołączył bodziec dźwiękowy. Z czasem zauważył, że psy utożsamiają dany dźwięk z jedzeniem i ślinią się w reakcji na dźwięk nawet wtedy, gdy nie towarzyszy temu jedzenie.
Warunkowanie instrumentalne
Kolejnym aspektem procesu uczenia jest warunkowanie instrumentalne, czyli budowanie skojarzenia pomiędzy zachowaniem a jego konsekwencjami. Możemy zwiększyć prawdopodobieństwo wystąpienia danego zachowania za pomocą wzmocnień lub możemy je zmniejszyć, eliminując oczekiwaną nagrodę czy wprowadzając karę za zachowanie. W rzeczywistości uczenie psów określonych zachowań bardzo rzadko opiera się tylko na wzmocnieniu klasycznym lub instrumentalnym. Zazwyczaj oba procesy dopełniają się nawzajem. Idea klikera bezpośrednio nawiązuje do obu rodzajów uczenia.
Na zasadzie warunkowania klasycznego wyrabia się skojarzenie w umyśle psa, że „klik” oznacza nagrodę. Dopiero w następnej kolejności asocjacja ta jest wykorzystana do nauki konkretnego zachowania. Działanie klikera opiera się na założeniu, że wzmocnienie pozytywne wcale nie oznacza jedynie smakołyków lub nagród udzielanych bezpośrednio. Pies podczas szkolenia klikerowego nie pracuje, aby dostać smakołyk – on pracuje, aby usłyszeć klik. Dźwięk ten jest „magicznym sygnałem”, który powoduje, że pies z coraz większą precyzją i dokładnością wykonuje ćwiczenia.
Jak to działa?
Pierwszym krokiem w szkoleniu psa jest nauczenie go, że za każdym razem, gdy usłyszy „klik”, otrzyma nagrodę. Gdy zwierzę już wie, że „klik” oznacza „zaraz dostanę nagrodę”, można użyć klikera w celu zaznaczenia zachowań, które nam się podobają, a następnie stopniowo kształtować je, podnosząc swoje wymagania i budować coś bardziej złożonego, np. reakcję na komendę.
Wyobraźmy sobie, że pies kilka razy usłyszał „klik” (a następnie dostał nagrodę) dokładnie w momencie, w którym akurat przeskakiwał przez przeszkodę. Szybko zacznie skakać w górę w nadziei na kolejne nagrody.
W następnej kolejności powinniśmy nauczyć go, że skakanie „działa” tylko wtedy, gdy właściciel powie „hop”. Stopniowo możemy dodawać kolejne warunki, np. klikamy tylko wtedy, gdy pies nie dotknie przeszkody, którą przeskakuje. Należy jasno podkreślić, że dźwięk klikera nie jest użyty jako komenda. Nie jest też dla psa wskazówką, aby zaczął coś robić. Do tego służy komenda słowna lub gest ręką.
Dźwięk klikera daje zwierzęciu znać, że zachowanie spodobało się właścicielowi i zasłużył na nagrodę. Nie musimy trzymać się ciągle jedzenia, równie dobrze możemy skojarzyć „klik” z poklepaniem lub podaniem zabawki. Dźwięk klikera staje się wtedy tzw. warunkowym bodźcem wzmacniającym. W psychologii jedzenie, pieszczota lub jakakolwiek inna przyjemność są wzmocnieniem bezwarunkowym – czymś, czego pies pragnie sam z siebie. Dźwięk klikera jest natomiast wzmocnieniem warunkowym, czyli czymś, czego zwierzę na drodze warunkowania klasycznego nauczyło się chcieć.
Można w tym miejscu zadać pytanie, dlaczego warunkowy bodziec wzmacniający jest istotny. Wyobraźmy sobie, że uczymy psa wykonywać pojedynczy skok przez przeszkodę bez użycia klikera. Nie jesteśmy w stanie dać mu nagrody podczas skoku. Zatem bez względu na to, jak ten skok będzie wyglądał, pies dostanie nagrodę później lub nie dostanie jej wcale. Pies nie jest w stanie szybko przekonać się, dlaczego raz jest nagradzany za wykonanie tej samej komendy, natomiast za drugim razem już nie. Z kolei po wprowadzeniu sygnału warunkowego jesteśmy w stanie precyzyjnie podkreślić, że podoba nam się zachowanie psa dokładnie w danej chwili, dając mu tym samym precyzyjne wskazówki co do naszych oczekiwań. Dobrze uwarunkowane zwierzę skupia się na wykonaniu zadania, nasłuchując „magicznego dźwięku”, a nie na smaczkach; uruchamia myślenie, a nie uczy się ślepego podążania za smakołykami.
Rozpoczęcie pracy z klikerem krok po kroku
Początkowo opanowanie klikera może stanowić problem dla właściciela. Wymaga to odpowiedniej koordynacji ruchowej. Szczególnie jeżeli szkolenie odbywa się poza domem, musimy jeszcze umieć opanować psa, którego trzeba dodatkowo prowadzić na smyczy. Dobrze jest w tym celu do klikera doczepić gumkę, którą możemy założyć na nadgarstku jak bransoletkę i mieć do niego szybki dostęp, gdy tylko będzie potrzebny. Dużym ułatwieniem jest specjalna saszetka na smakołyki, którą można dopiąć do paska. Nie musimy wtedy trzymać ich w ręce, a są one zawsze w pogotowiu. Smakołyki powinny być na tyle małe, aby nie było zagrożenia, że pies się nimi naje. Jeżeli pies chętnie zjada swoją karmę, można jej użyć jako nagrody i jeden posiłek zamiast z miski podawać w trakcie szkolenia.
- W pierwszym kroku uczymy psa, co oznacza „klik” – naciskamy kliker i podajemy smakołyk. Staramy się wykonać tę czynność kilkakrotnie w różnych miejscach, aby nauczyć psa, że kliker obowiązuje wszędzie.
- W następnej kolejności klikamy i staramy się zbadać reakcję psa. Jeżeli skupia na nas swoją uwagę i z niecierpliwieniem rozgląda się za nagrodą, oznacza to, że kliker stał się warunkowym bodźcem wzmacniającym. Jest to czas, aby podnieść poprzeczkę i wprowadzić nowe oczekiwania. Starajmy się teraz klikać i nagradzać psa tylko wtedy, kiedy pies skupia się na nas i patrzy nam w oczy.
- Po kilku powtórzeniach pies nie będzie już miał z tym najmniejszego problemu. Jest to świetne ćwiczenie, od którego powinniśmy rozpocząć każdą sesję szkoleniową. Na tym etapie można wypracować z psem dowolne zachowanie, naprowadzając go na to krok po kroku.
Metoda ta nazywa się kształtowaniem. Idea przypomina zasadę działania kinematografu, w którym ruchomy obraz przedstawiany jest za pomocą szybko zmieniających się klatek (ujęć obrazów). Wyobraźmy sobie, że chcemy za pomocą kinematografu przedstawić psa, który płynnym ruchem zasłania sobie łapą oczy, jakby czuł się zawstydzony tym, co właśnie zobaczył. Pierwszy obraz przedstawiałby siedzącego psa, na drugim pies miałby już jedną łapę uniesioną w górę, która stopniowo unosiłaby się w kierunku głowy. Wyobrażając sobie to w taki sposób, jesteśmy w stanie zaprojektować każdą sztuczkę i za pomocą klikera naprowadzać psa na zrealizowanie planu kawałek po kawałku czy też klatka po klatce.
Można w tym miejscu zadać pytanie, jak nakłonić psa na samym początku do podniesienia łapy i zbliżenia jej w stronę pyska. Jest na to wiele sposobów i musimy wykazać się kreatywnością. Najprostszym sposobem jest przyklejenie psu nad okiem kawałka taśmy klejącej, którą pies będzie chciał strącić łapą, i klikanie za każdym razem, kiedy będzie chciał to zrobić. Pies szybko straci zainteresowanie samą taśmą i zacznie skupiać się na „magicznym dźwięku”. Będzie chętnie realizował nasze instrukcje, aby uzyskać nagrodę.
Eliminacja niepożądanych zachowań
Kliker może zostać wykorzystany nie tylko w celu wzmocnienia pożądanych reakcji – umiejętnie wykorzystany pozwoli nam także na wyeliminowanie zachowań, których nie chcemy. W tym celu przede wszystkim powinniśmy wprowadzić warunkowy bodziec wygaszający, który da psu do zrozumienia, że gdy będzie podążał tą drogą, nagroda będzie dla niego niedostępna. Słysząc ten dźwięk, zwierzę szybko uczy się, że robi źle, i powinno zmienić swoje zachowanie.
W praktyce może to być jakiekolwiek słowo: „nie”, „fuj”, „ee”, które łatwo nam w tej sytuacji wypowiedzieć. Tak rozumiane szkolenie klikerowe przypomina dziecięcą zabawę w ciepło – zimno. Pies chce zdobyć nagrodę i uczy się podążać za dźwiękiem klikera. Gdy pies zaczyna prezentować nieakceptowalne zachowanie, możemy użyć sygnału, który daje psu do zrozumienia, że oddala się od zdobycia nagrody.
Kolejną metodą na wyeliminowanie złego zachowania jest wprowadzenie zachowania zastępczego, za wykonanie którego pies zostanie nagrodzony, a które uniemożliwi prezentowanie zachowania, które chcemy wygasić. Na przykład chcąc oduczyć psa skakania na powitanie, możemy zaraz po wejściu do mieszkania dać mu komendę „siad – zostań” i nagrodzić go powitaniem tylko wtedy, gdy wykona polecenie. Dobrym sposobem jest także wprowadzenie w trakcie pracy szkoleniowej tzw. przerw. W momencie gdy pies staje się niesforny i przestaje reagować na wskazówki i komendy, możemy obrócić się do niego plecami, odłożyć kliker i smakołyki i odejść, przerywając kontakt. Po kilku takich powtórzeniach pies zacznie bardziej zwracać uwagę na swoje zachowanie i będzie się bardziej pilnował.
Zasady pracy szkoleniowej z psem
Nauka psa – bez względu na to, czy używamy warunkowego bodźca wzmacniającego w postaci klikera, czy też nie – powinna być odpowiednio usystematyzowana.
- Krótkie sesje treningowe
Pies bardzo szybko się dekoncentruje, dlatego też praca powinna składać się z kilku sesji trwających nie dłużej niż trzy minuty. Sesje treningowe powinno się zakończyć, kiedy pies jeszcze doskonale się bawi, zanim się zmęczy i znudzi. Dzięki temu pies nie będzie mógł się doczekać następnej lekcji. Pomiędzy tymi sesjami powinniśmy pozwolić psu zrelaksować się poprzez zabawę lub żucie. Dobrze, jeżeli koniec sesji zostanie zaznaczony jasnym sygnałem, aby pies wiedział, że teraz jest czas wolny i już nie musi skupiać się na pracy. - Zakończ naukę na sukcesie psa
Każda sesja szkoleniowa zawsze powinna skończyć się na sukcesie psa. Jeżeli ćwiczymy komendę, którą trudno jest psu zrozumieć i nie zawsze mu ona wychodzi, staramy się wrócić pod koniec do łatwiejszych zadań, aby pies czuł, że jesteś z niego dumny i zadowolony. - Nie okazuj frustracji
Szkolenie psa wymaga czasu i wielu powtórzeń. Podczas nauki nowej sztuczki pies może zacząć kręcić się niespokojnie i nie widzieć nic poza smakołykiem. Jeśli podczas pracy z psem poczujemy, że ogarnia nas irytacja, powinniśmy przerwać naukę i odłożyć na dzień, w którym będziemy mieć więcej cierpliwości. - Uspokajaj rozbrykanego psa
Czasami psy ekscytują się podczas szkolenia tak mocno, że niezbędne jest ich uspokojenie, aby dalsza praca była możliwa. W tym celu należy odwrócić się bokiem i stanąć na kilka sekund z rękami opuszczonymi wzdłuż ciała. W ten sposób informujemy psa, że za takie postępowanie nie otrzyma nagrody i musi się bardziej skupić na nas. Gdy to nie skutkuje, odkładamy smaczki i kliker, i przerywamy kontakt z psem, robiąc przerwę. Kilka sekund zwykle wystarczy, aby pies trochę ochłonął. - Niech szkolenie będzie dla Was zabawą
Im więcej pozytywnych emocji wzbudzimy u siebie i psa, tym chętniej będzie się uczył i chciał z nami pracować.
Najważniejsze zasady pracy z klikerem
- Klikaj, aby zaznaczyć każde zachowanie, do którego chcesz zachęcać.
- Reaguj natychmiast – klikaj w momencie, kiedy pies robi to, co powinien.
- Po każdym kliknięciu pies powinien dostać smakołyk (nie stosuj serii kliknięć).
Bibliografia
- Pryor K., Kliker – skuteczne szkolenie psa, Galaktyka, Łódź 2007.
- Sundance K., 51 sztuczek dla szczeniaków. Jak aktywizować swojego pupila krok po kroku, Muza, Warszawa 2009.