[ Pobierz całość w formacie PDF ]
.By przekonać się, że jest toautentyczna gra w Dylemat Więznia, wystarczy przyjrzeć się możliwym końcowym rezultatom.Wzajemnawspółpraca (usuwanie sobie nawzajem kleszczy) daje dość dobry wynik, lecz wciąż mamy chęć, by odmówiwszypłacenia kosztów odwzajemnienia się uzyskać jeszcze więcej.Obustronna zdrada (odmowa usuwania kleszczy) jestdość marnym wynikiem, ale nie aż tak złym, jak wariant, w którym włożyło się wysiłek w usunięcie komuśkleszczy, a samemu wciąż jest się przez nie opanowanym.Oto tabela wygranych:Jest to zaledwie jeden przykład.Lecz im dłużej będziemy się nad tym zastanawiać, tym bardziejutwierdzimy się w przekonaniu, że życie, i to nie tylko człowieka, ale również zwierząt i roślin, jest nie kończącymsię pasmem gier w Iterowany Dylemat Więznia.Roślin też? A czemuż by nie? Pamiętaj, że nie chodzi nam oświadome strategie (chociaż czasami są i takie), ale o strategie w znaczeniu podanym przez Maynarda Smitha, takie,które geny mogłyby zawczasu zaprogramować.W dalszej części rozdziału spotkamy rośliny, różne gatunki zwierząt,a nawet bakterie grające w Iterowany Dylemat Więznia.Najpierw jednak zanalizujmy dokładniej, co ważnego kryjesię w iteracji.W przeciwieństwie do prostej gry, w której, jak łatwo przewidzieć, jedyną racjonalną strategią jest zdrada,wersja iterowana oferuje bogactwo strategicznych wariantów.W prostej grze możliwe są tylko dwie strategie:współpraca i zdrada.Iteracja dopuszcza natomiast wielką różnorodność strategii, z których żadna nie jest wrzucający się w oczy sposób najlepsza.Oto przykład jednej spośród tysięcy możliwości: Przez większość czasuwspółpracuj, ale w dowolnej jednej z dziesięciu rund zdradzaj.Strategie mogą też być uzależnione odwcześniejszego przebiegu gry.Jej przykładem jest mój pamiętliwy.Ma dobrą pamięć do twarzy i, choć przejawiagotowość do współpracy, zdradza, jeśli przeciwnik zdradził go kiedykolwiek przedtem.Inne strategie mogą byćbardziej wielkoduszne i mieć krótszą pamięć.Zaiste, w grze iterowanej liczbę potencjalnych strategii ogranicza tylko nasza pomysłowość.Czypotrafilibyśmy ustalić, która z nich jest najlepsza? Taki właśnie cel wyznaczył sobie Axelrod.Wpadł na ciekawypomysł zorganizowania zawodów i zwrócił się do ekspertów od teorii gier z zachętą do zgłaszania swoich strategii.Strategie miały mieć w tym przypadku postać zaprogramowanych reguł postępowania, co umożliwiałowspółzawodnikom nadsyłanie swoich zgłoszeń w języku komputerowym.Przysłano czternaście strategii.Jakokontrolną Axelrod dodał piętnastą, nazwaną przypadkową, która po prostu na chybił trafił grała WSP�APRACA lubZDRADA i służyła jako swego rodzaju niestrategiczny poziom odniesienia: jeśli jakaś strategia wypada gorzej odprzypadkowej, to musi być naprawdę kiepska.Axelrod zapisał wszystkie 15 strategii w tym samym języku programowania i wystawił je przeciwko sobiew jednym dużym komputerze.Każda, ze strategii grała w Iterowany Dylemat Więznia kolejno przeciwko wszystkimpozostałym (w tym ze swoją własną kopią).Strategii było 15, toteż odbyło się 15 x 15, czyli 225 osobnych spotkań.Każde z nich składało się z 200 rund.Wygrane z nich wszystkich były sumowane, po czym ogłaszano zwycięzcę.Nie jest dla nas istotne, że ta czy tamta strategia okazała się lepsza od jakiejś jeszcze innej.Ważne jest to,która strategia zgromadziła po podsumowaniu wszystkich 15 spotkań najwięcej pieniędzy. Pieniądze były poprostu punktami przyznawanymi według następującego schematu: wzajemna współpraca - 3 punkty, zachęta dozdrady - 5 punktów, kara za wzajemną zdradę - 1 punkt (odpowiednik niskiej grzywny w naszej wcześniejszej grze),zarobek frajera - 0 punktów (odpowiednik wysokiej grzywny w naszej wcześniejszej grze).Najlepszy teoretycznie możliwy do uzyskania przez strategię wynik wynosił 15 000 (200 rund, przy 5punktach z każdej rundy i 15 przeciwnikach).Wynik minimalny wynosił 0.Nie muszę dodawać, że żadna z tychskrajności nie została osiągnięta.Największa wygrana, na jaką przeciętnie liczyć może strategia w każdym ze swoich15 spotkań, nie może wynieść wiele ponad 600 punktów.Po tyle otrzymaliby obaj gracze, gdyby konsekwentniewspółpracowali i zarabiali po 3 punkty w każdej z 200 rund gry.Gdyby jeden z nich uległ pokusie zdrady,prawdopodobnie uzyskałby w rezultacie mniej niż 600 punktów, na skutek odwetu ze strony drugiego gracza (rodzajzachowania odwetowego został wbudowany do większości nadesłanych strategii).Wartość 600 możemy więc uznaćza wynik wzorcowy dla gry i wszystkie wyniki wyrażać jako procent tego wyniku.W tej skali teoretycznie możliwejest uzyskanie wyniku 166 procent - równoważne 1000 punktów, lecz w praktyce średni wynik żadnej ze strategii nieprzekroczył 600.Miej na uwadze, że graczami w turnieju nie są ludzie, lecz programy komputerowe - zaplanowanewcześniej strategie [ Pobierz całość w formacie PDF ]
zanotowane.pl doc.pisz.pl pdf.pisz.pl milosnikstop.keep.pl
.By przekonać się, że jest toautentyczna gra w Dylemat Więznia, wystarczy przyjrzeć się możliwym końcowym rezultatom.Wzajemnawspółpraca (usuwanie sobie nawzajem kleszczy) daje dość dobry wynik, lecz wciąż mamy chęć, by odmówiwszypłacenia kosztów odwzajemnienia się uzyskać jeszcze więcej.Obustronna zdrada (odmowa usuwania kleszczy) jestdość marnym wynikiem, ale nie aż tak złym, jak wariant, w którym włożyło się wysiłek w usunięcie komuśkleszczy, a samemu wciąż jest się przez nie opanowanym.Oto tabela wygranych:Jest to zaledwie jeden przykład.Lecz im dłużej będziemy się nad tym zastanawiać, tym bardziejutwierdzimy się w przekonaniu, że życie, i to nie tylko człowieka, ale również zwierząt i roślin, jest nie kończącymsię pasmem gier w Iterowany Dylemat Więznia.Roślin też? A czemuż by nie? Pamiętaj, że nie chodzi nam oświadome strategie (chociaż czasami są i takie), ale o strategie w znaczeniu podanym przez Maynarda Smitha, takie,które geny mogłyby zawczasu zaprogramować.W dalszej części rozdziału spotkamy rośliny, różne gatunki zwierząt,a nawet bakterie grające w Iterowany Dylemat Więznia.Najpierw jednak zanalizujmy dokładniej, co ważnego kryjesię w iteracji.W przeciwieństwie do prostej gry, w której, jak łatwo przewidzieć, jedyną racjonalną strategią jest zdrada,wersja iterowana oferuje bogactwo strategicznych wariantów.W prostej grze możliwe są tylko dwie strategie:współpraca i zdrada.Iteracja dopuszcza natomiast wielką różnorodność strategii, z których żadna nie jest wrzucający się w oczy sposób najlepsza.Oto przykład jednej spośród tysięcy możliwości: Przez większość czasuwspółpracuj, ale w dowolnej jednej z dziesięciu rund zdradzaj.Strategie mogą też być uzależnione odwcześniejszego przebiegu gry.Jej przykładem jest mój pamiętliwy.Ma dobrą pamięć do twarzy i, choć przejawiagotowość do współpracy, zdradza, jeśli przeciwnik zdradził go kiedykolwiek przedtem.Inne strategie mogą byćbardziej wielkoduszne i mieć krótszą pamięć.Zaiste, w grze iterowanej liczbę potencjalnych strategii ogranicza tylko nasza pomysłowość.Czypotrafilibyśmy ustalić, która z nich jest najlepsza? Taki właśnie cel wyznaczył sobie Axelrod.Wpadł na ciekawypomysł zorganizowania zawodów i zwrócił się do ekspertów od teorii gier z zachętą do zgłaszania swoich strategii.Strategie miały mieć w tym przypadku postać zaprogramowanych reguł postępowania, co umożliwiałowspółzawodnikom nadsyłanie swoich zgłoszeń w języku komputerowym.Przysłano czternaście strategii.Jakokontrolną Axelrod dodał piętnastą, nazwaną przypadkową, która po prostu na chybił trafił grała WSP�APRACA lubZDRADA i służyła jako swego rodzaju niestrategiczny poziom odniesienia: jeśli jakaś strategia wypada gorzej odprzypadkowej, to musi być naprawdę kiepska.Axelrod zapisał wszystkie 15 strategii w tym samym języku programowania i wystawił je przeciwko sobiew jednym dużym komputerze.Każda, ze strategii grała w Iterowany Dylemat Więznia kolejno przeciwko wszystkimpozostałym (w tym ze swoją własną kopią).Strategii było 15, toteż odbyło się 15 x 15, czyli 225 osobnych spotkań.Każde z nich składało się z 200 rund.Wygrane z nich wszystkich były sumowane, po czym ogłaszano zwycięzcę.Nie jest dla nas istotne, że ta czy tamta strategia okazała się lepsza od jakiejś jeszcze innej.Ważne jest to,która strategia zgromadziła po podsumowaniu wszystkich 15 spotkań najwięcej pieniędzy. Pieniądze były poprostu punktami przyznawanymi według następującego schematu: wzajemna współpraca - 3 punkty, zachęta dozdrady - 5 punktów, kara za wzajemną zdradę - 1 punkt (odpowiednik niskiej grzywny w naszej wcześniejszej grze),zarobek frajera - 0 punktów (odpowiednik wysokiej grzywny w naszej wcześniejszej grze).Najlepszy teoretycznie możliwy do uzyskania przez strategię wynik wynosił 15 000 (200 rund, przy 5punktach z każdej rundy i 15 przeciwnikach).Wynik minimalny wynosił 0.Nie muszę dodawać, że żadna z tychskrajności nie została osiągnięta.Największa wygrana, na jaką przeciętnie liczyć może strategia w każdym ze swoich15 spotkań, nie może wynieść wiele ponad 600 punktów.Po tyle otrzymaliby obaj gracze, gdyby konsekwentniewspółpracowali i zarabiali po 3 punkty w każdej z 200 rund gry.Gdyby jeden z nich uległ pokusie zdrady,prawdopodobnie uzyskałby w rezultacie mniej niż 600 punktów, na skutek odwetu ze strony drugiego gracza (rodzajzachowania odwetowego został wbudowany do większości nadesłanych strategii).Wartość 600 możemy więc uznaćza wynik wzorcowy dla gry i wszystkie wyniki wyrażać jako procent tego wyniku.W tej skali teoretycznie możliwejest uzyskanie wyniku 166 procent - równoważne 1000 punktów, lecz w praktyce średni wynik żadnej ze strategii nieprzekroczył 600.Miej na uwadze, że graczami w turnieju nie są ludzie, lecz programy komputerowe - zaplanowanewcześniej strategie [ Pobierz całość w formacie PDF ]