[ Pobierz całość w formacie PDF ]
.Istnieje oczywiście szereg zasad, których trzeba przestrzegać, stosując wzmocnienia pozytywne (prościej mówiąc — metodę nagradzania) jako technikę szkoleniową, ale zanim zaczniemy je stosować w praktyce, musimy dokładnie wiedzieć, jaki efekt chcemy uzyskać w każdym stadium ćwiczenia.Myślę, że stosowanie niezwykle uczonych nazw dla każdego z etapów, składających się na całe ćwiczenie, znudziłoby śmiertelnie każdego czytelnika lub, co gorsza, zniechęciło go do dalszej lektury.W końcu, jeśli kogoś zainteresują głębsze naukowe podstawy tego procesu, zawsze może poszukać książek z tej dziedziny w najbliższej bibliotece.Nas interesuje zastosowanie tej metody treningu w praktyce.Zasady postępowaniaPrzede wszystkim nie możemy traktować każdego ćwiczenia jako integralnej całości.Musimy postępować metodą kolejnych kroków we właściwym kierunku.Wróćmy do przykładu, którego użyłem wcześniej —jak nauczyć orkę wyskakiwania z wody na gwizdek.Stojąc nad basenem trener gwiżdże (komenda), czeka, znów gwiżdże, robi krótką przerwę itd.W tym momencie dla orki gwizd jest nic nie znaczącym dźwiękiem, ale gdy tylko, z jakiejkolwiek przyczyny, wystawi nos z wody, treser gwiżdże, dając jej równocześnie rybę.Tę procedurę treser powtarza tak długo, aż w świadomości orki powstanie skojarzenie “Kiedy słyszę gwizdek, dostaję rybę".To skojarzenie uznaje się za utrwalone, kiedy na dziesięć gwizdków orka wystawi nos z wody dziesięć razy.Na razie trzeba na tym poprzestać.W pierwszych stadiach ćwiczenia nauka nie postępuje zbyt szybko.Bardzo ważne jest, dla pełnego opanowania ćwiczenia, dokładne utrwalenie w pamięci zwierzęcia tych pierwszych kroków.Sami się przekonacie, że kiedy w początkach ćwiczenia zwierzę będzie dokładnie wiedziało, jaki jest związek między komendą i nagrodą, czyli czego od niego oczekujesz, dalsza nauka pójdzie błyskawicznie.Teraz treser przechodzi do stadium modelowania.Do tej pory ćwiczenie wyglądało tak: gwizdek — nos orki nad wodą — za każdym razem ryba w nagrodę.Teraz trzeba dojść do modelu: gwizdek — orka wyskakuje z wody — ryba od czasu do czasu w nagrodę.Modelowanie polega na dochodzeniu krok po kroku do założonego z góry efektu, przy czym musimy mieć pewność, że każdy etap został starannie utrwalony.Fenomenem tej metody jest to, że o ile początkowo zwierzę nagradzamy za każdy najdrobniejszy krok w pożądanym kierunku, o tyle w następnej kolejności redukujemy nagrody, mając pewność, że skojarzyło ono na zawsze komendę z oczekiwaną reakcją.Kiedy treser ma już całkowicie pewność, że orka wystawia nos z wody na każdy gwizdek, przy kolejnej powtórce decyduje “Niedostatecznie, nie ma ryby".Orka jest zaskoczona “Co jest, zawsze była ryba na gwizdek, może ktoś mi ją sprzątnął sprzed nosa, następnym razem muszę to sprawdzić".W rezultacie przy następnym gwizdku wynurza się szybciej i całą głową.Oczywiście dostaje rybę.Teraz treser utrwala w pamięci zwierzęcia schemat: gwizdek — cała głowa nad wodą — ryba.Utrwaliwszy, przechodzi do następnego etapu.Nauka kolejnych etapów trwa coraz krócej.Zwierzę szybciej pojmuje, czego się od niego oczekuje.Jest to zjawisko lawinowe — najpierw wolniutko, potem coraz szybciej i szybciej.Przykładu orki użyłem z pełną premedytacją, aby pokazać, że nauka zwierząt nie musi, czasami wręcz nie może, opierać się na przemocy fizycznej.Trzeba poczekać na pierwszy krok we właściwym kierunku, nagrodzić, a potem modelować dalsze postępowanie.Pytanie: Jaka jest różnica między tą metodą a przekupstwem? Odpowiedź: Przekupstwo stosujemy wtedy, gdy używamy nagrody jako przynęty, aby sprowokować pożądaną reakcję, tu zaś nagradzamy spontaniczne działanie w pożądanym kierunku.Pytanie: Czy zawsze trzeba dawać nagrodę? Odpowiedź: Efekt jest lepszy, jeśli nie zawsze.Kiedy jakiś etap jest dobrze utrwalony, wtedy tylko szybko i efektownie wykonane ćwiczenie powinno być nagrodzone.Czasami dopiero za szóstym lub siódmym razem.Pytanie: Czy nagrodą musi być jedzenie?Odpowiedź: Musi to być coś, co z punktu widzenia ucznia warte jest wysiłku.Ja, na przykład, nigdy bym się nie wysilał dla talerza kapusty.Nie znoszę kapusty.Zastosujmy to w praktycePoprzednio opowiadałem o tym, jak uczyłem aportowania mojego pierwszego psa.Opowiem teraz, jak robię to dziś.Mój pierwszy pies nauczył się po paru tygodniach aportowania, ale nigdy nie był to “występ w wielkim stylu", choć był to owczarek niemiecki — rasa znana z łatwości uczenia się.Mój obecny pies wykonuje to ćwiczenie z błyskiem w oku i niezwykle szybko, choć to akita inu.Jest to rasa znana z uporu i niełatwa w układaniu.Z moim owczarkiem spędzałem wiele godzin dziennie przez kilka tygodni na treningach, zanim pojął, w czym rzecz.Akicie poświęcałem kilka minut dziennie, przez parę dni i ani razu nawet nie wstałem z krzesła.Tę samą metodę zastosowałem ostatnio w uczeniu pewnego policyjnego owczarka niemieckiego.Nauczył się aportowania na poziomie wymaganym przez Ministerstwo Spraw Wewnętrznych w czasie o połowę krótszym niż psy uczone tradycyjnymi metodami.Moja akita nazywała się Yoko.No, wiecie, John i Yoko.Miała piętnaście miesięcy, kiedy zdecydowałem nauczyć ją aportowania.Co prawda nie mam teraz czasu, aby uczestniczyć w próbach pracy, ale sędziuję je czasami.Właściwie to jeden z uczestników konkursu sprowokował mnie do tego uwagą “Nigdy nie uda się nauczyć akity prawidłowego aportowania".Wystarczyło, by ambicje we mnie zagrały!Siedząc przy biurku w moim biurze położyłem w zasięgu ręki parę smakowitych kąsków.Trzymając w ręku koziołek powiedziałem “przynieś to".Yoko obwąchała to, a ja ze słowami “dobry pies" dałem jej nagrodę.Ta pierwsza lekcja nie trwała dłużej niż pięć minut i około 60% reakcji mojej uczennicy zasługiwało na nagrodzenie.Reszta to wskakiwanie na mnie, drapanie łapami, a nawet szczekanie, aby tylko dostać smakołyk.Tego samego dnia przy następnej sesji ćwiczeniowej osiągnęliśmy poziom skojarzenia.Yoko trącała nosem koziołek na mój sygnał za każdym razem.Modelowanie następnego etapu zajęło nam nieco więcej czasu.Chciałem, żeby polizała koziołek, zamiast trącać go nosem.Poświęciliśmy na to cztery pięciominutowe sesje.Procent prawidłowy reakcji układał się następująco — 15%, 25%, 70%, 100%.Kiedy przestałem nagradzać Yoko za lizanie koziołka, okazało się, że efekt lawiny osiągnąłem w czasie krótszym od spodziewanego [ Pobierz całość w formacie PDF ]