niedziela, 14 maja 2017

EMNN #13: Pudełka Newcomba


Pod ostatnim wpisem o imperatywie kategorycznym dyskusja poszła w stronę teorii decyzji. Pomyślałem więc, że w tym odcinku Eksperymentu Myślowego na Niedzielę napiszę o jednym z dwóch najsłynniejszych eksperymentów myślowych z tej dziedziny, czyli paradoksie Newcomba. Jego autorem jest fizyk William Newcomb, ale pierwszy artykuł na ten temat opublikował Robert Nozick w 1969, stąd kanoniczna wersja problemu pochodzi z tego właśnie artykułu (tłumaczenie moje):

Wyobraź sobie istotę, do której masz ogromne zaufanie, jeśli chodzi o jej zdolność do przewidywania twoich wyborów. (Można tu opowiedzieć historię science-fiction o istocie z innej planety, gdzie nauka i technologia są dużo bardziej zaawansowane; wiesz o tej istocie, że jest ci przyjazna itd.) Wiesz, że istota ta wiele razy trafnie przewidywała twoje wybory w przeszłości i że nigdy, o ile ci wiadomo, nie pomyliła się w przewidywaniu twoich wyborów. Ponadto wiesz, że wiele razy przewidywała też trafnie wybory innych ludzi, wielu z nich bardzo podobnych do ciebie, w sytuacji takiej jak ta, która za chwilę zostanie opisana. Można opowiedzieć dłuższą historię, w każdym razie jednak wszystko to skłania cię do przekonania, że predykcja dotycząca twojego wyboru w poniższej sytuacji będzie prawie na pewno trafna.
Mamy dwa pudełka, (B1) i (B2). (B1) zawiera tysiąc dolarów. (B2) zawiera albo milion dolarów, albo nic. To, od czego zależy zawartość (B2), zostanie opisane za chwilę. (…)

Masz następujący wybór:
(1) wziąć zawartość obu pudełek
(2) wziąć zawartość tylko drugiego pudełka

Ponadto wiesz, że (istota wie też, że ty wiesz itd.):
(I) Jeśli istota przewidziała, że weźmiesz zawartość obu pudełek, to nie umieści miliona w drugim pudełku.
(II) Jeśli istota przewidziała, że weźmiesz tylko zawartość drugiego pudełka, to umieści milion w tym pudełku.

Sytuacja wygląda więc następująco: najpierw istota przewiduje, co zrobisz. Następnie wkłada milion do drugiego pudełka, lub nie wkłada – w zależności od tego, co przewidziała. Następnie dokonujesz wyboru. Na co się decydujesz?


Z jednej strony wydaje się, że lepiej wziąć dwa pudełka – bo w końcu sam wybór nie sprawi ani że milion w drugim pudełku się w magiczny sposób pojawi, ani że zniknie. On już tam jest – albo go nie ma – i nic tego nie zmieni. Wybierając dwa pudełka bierzemy więc na pewno o tysiąc dolarów więcej, niż wybierając jedno. Z drugiej strony wydaje się, że lepiej wziąć jedno pudełko – bo wiadomo, że prawie na pewno skończymy wtedy z milionem, a jeśli weźmiemy oba pudełka, to prawie na pewno skończmy tylko z tysiącem. Używając fachowych terminów: z zasady dominacji wynika, że powinniśmy wziąć dwa, a z zasady oczekiwanej użyteczności, że jedno.
Nozick pisze, że prawie wszyscy jego znajomi i studenci, których konfrontował z problemem, twierdzili od razu, że odpowiedź jest jasna, a jeśli ktoś się z nimi nie zgadza, najwyraźniej „po prostu się wygłupia”. Przy czym dla połowy z nich odpowiedzią tą było jedno pudełko, a dla drugiej dwa pudełka. Moje doświadczenie było zupełnie inne: kiedy pierwszy raz przeczytałem o problemie, moją reakcją było „nie mam pojęcia”. Nie przeczę jednak, że wielu ludzi silna intuicja może prowadzić w jedną lub w drugą stronę.
Co może wynikać z kilku rzeczy. Po pierwsze, warto zauważyć, że eksperyment myślowy jest oparty na pewnym milczącym założeniu: „1 dolar = 1 jednostka użyteczności”. Dla niektórych pytanych może nie być to jasne. Ktoś może być tak bogaty, że tysiąc dolarów mniej czy więcej na koncie nie zrobi mu praktycznie żadnej różnicy. Inny ktoś wziął lichwiarską pożyczkę i wie, że jeśli do jutra nie odda tysiąca (którego nie ma), to przyjdą osiłki łamać mu kończyny. Dla obu tych ludzi ten sam tysiąc z pierwszego pudełka będzie miał skrajne różną wartość, przez co opcja wzięcia obu pudełek będzie w różnym stopniu atrakcyjna.
Po drugie, problemem może być też to, o czym pisałem przy okazji eksperymentu z maszyną doznań (swoją drogą tez Nozicka): że ludzie często mimowolnie wyobrażają sobie coś innego, niż autor eksperymentu chce, by sobie wyobrazili. W przypadku pudełek może się wydawać, że żadna istota nie jest w stanie przewidywać naszych wyborów z taką dokładnością. Nozick może sobie pisać, że „predykcja będzie prawie na pewno trafna”, a czytelnik i tak wyobrazi sobie, że wcale nie tak na pewno. I wtedy opcja wzięcia dwóch pudełek zrobi się bardziej atrakcyjna. Można oczywiście zauważyć, że nawet jeśli skuteczność przewidywania jest bardzo niska, z zasady oczekiwanej użyteczności nadal będzie wynikało, że należy wziąć jedno pudełko. Powiedzmy, że przewidywania istoty sprawdzają się tylko w 51% przypadków – nawet wtedy wychodzi, że lepiej wziąć jedno pudełko, bo oczekiwana użyteczność tego wyboru to 510 000, a oczekiwana użyteczność wyboru dwóch pudełek to tylko 491 000. Ale ludzie najczęściej nie myślą w ten sposób (gdyby tak myśleli, to pewnie nikt nie chodziłby do kasyn ani nie grał na loterii).
Po trzecie, myślę, że przewidywanie wyboru w takiej sytuacji z dokładnością choć minimalnie większą niż 50% może się niektórym wydawać niemożliwe. Nie dlatego, że według nich ludzkich wyborów w ogóle nie da się trafnie przewidywać – oczywiście, że się da, w każdym razie w przypadku zdrowych psychicznie ludzi – ale dlatego, że w sytuacji, w której komuś zależy na tym, by predykcja na temat jego wyboru nie była wiarygodna (a z taką sytuacją mamy do czynienia w przypadku pudełek, do wzięcia jest przecież 1 001 000 dolarów), ktoś taki będzie, jak można się spodziewać, stosować triki, które uniemożliwią trafne przewidywanie. Przewidywacz będzie sobie myślał „Wydaje mi się, że weźmie jedno pudełko. Ale zaraz, może pomyśleć, że ja pomyślałem, że weźmie jedno, więc weźmie dwa. Ale zaraz, może pomyśleć, że ja pomyślałem, że on pomyślał, że ja pomyślałem, że weźmie jedno, więc weźmie dwa – i wtedy weźmie jedno. Ale zaraz, może pomyśleć...” I to go sparaliżuje. Niezależnie od tego, jak przewidywacz jest inteligentny, jakie ma zdolności obliczeniowe i jak wiele danych zgromadzi, nie będzie w stanie nic w tym wypadku przewidzieć. Jego zgadywanie będzie tyle samo warte, co rzut monetą. A skoro tak, to dwa pudełka to jedyny racjonalny wybór.
Takie rozumowanie jest chyba oparte na wierze w indeterministyczną wolną wolę. Jeśli o mnie chodzi, to jestem tej wiary pozbawiony – wydaje mi się, że przewidzenie wyboru nawet ze stuprocentową pewnością jest jak najbardziej możliwe. Ale myślę też, że od determinizmu do uznania jednego pudełka za racjonalny wybór jest daleka droga.