Backup: Teoria dos Jogos: descomplicando

Abaixo, reproduzo a valiosa contribuição do Bertini (mais uma!), desta vez sobre Teoria dos Jogos.
É um texto bastante explicativo, a despeito de longo. Mas vale a pena.

O Dilema do Prisioneiro

convict.gif (382 bytes)

A Teoria do Jogos

Você e seu cúmplice foram arrastados até a delegacia de polícia e colocados em celas separadas. O promotor diz a você que a polícia possui evidência suficiente para mandá-los para trás das grades por um ano, mas não o bastante para uma condenação mais pesada. Porém, se você confessar e concordar em depor contra seu cúmplice, você ficará livre por ter colaborado, e ele irá para a cadeia por três anos. Já se ambos confessarem o crime, os tiras não precisarão de sua cooperação e cada um sofrerá uma pena de dois anos. Você é levado a acreditar que a mesma proposta está sendo feita ao seu parceiro. O que você faz?

Esta é uma versão simples do "dilema do prisioneiro", um problema famoso na teoria do jogo, a matemática da decisão. (Existem outros dilemas na teoria do jogo, como o "dilema da galinha").

Talvez você não tenha sido preso nos últimos tempos e esteja se perguntando por que deveria se preocupar com isso. Na verdade, não é preciso procurar muito longe para achar outros dilemas do prisioneiro na vida diária. Se tiver chance, você fura uma fila?

Qual é sua reação àquelas insistentes campanhas de doação de sangue veiculadas em rádio e televisão?

Você lida com os seus problemas no escritório através da omissão ou da responsabilidade?

Em cada caso, você se defronta com um problema similar ao do prisioneiro: você realmente se sai melhor ao optar pelo comportamento egoísta?

O dilema é que a escolha não pode ser feita no terreno puramente racional. Para ver o porquê, vamos retornar ao nosso cenário inicial. Olhando por um lado, você se sai melhor confessando mas, por outro lado, você se sai melhor ficando quieto. Aqui estão as possibilidades organizadas em ordem:

	Parceiro fica calado	Parceiro confessa
Você fica calado	1 ano para você	3 anos para você
	1 ano para parceiro	0 anos para parceiro
Você confessa	0 anos para você	2 anos para você
	3 anos para parceiro	2 anos para parceiro

Obviamente, para você, o melhor resultado possível é você confessar e seu parceiro ficar calado. (Na linguagem da teoria do jogo, salvar sua própria pele, sem se importar com mais nada, é chamado "defecção".) E até mesmo se seu parceiro confessar, você ainda lucra por defectar, já que, se permanecer em silêncio, você pegará três anos de cadeia, enquanto que confessando você só vai pegar dois.

Em outras palavras, seja qual for a opção do seu parceiro (e você não tem jeito de saber a decisão dele), você se sai melhor defectando.

Porém, se seu parceiro for tão esperto quanto você, ele vai chegar à mesma conclusão: a escolha racional é confessar. Essa lógica vai, dessa forma, proporcionar a ambos dois anos na cadeia. Será que isso é realmente "racional" quando, se ambos ficassem calados ("cooperação"), cada um poderia pegar apenas um ano? No geral, a cooperação mútua é o melhor, já que a quantidade total de tempo que ambos pegariam seria de dois anos em vez de três.

Então, você deve cooperar, certo? Bem, suponhamos que o seu parceiro não chegue a essa conclusão, ou que ele chegue, mas decida se aproveitar de sua confiança, defectando. Neste caso, você terá que encarar o pior resultado possível: três anos vendo o sol nascer quadrado. O que vai ser: você confia nele ou não? O que é mais racional, cooperação ou defecção?

Esse problema e outros similares são provenientes da teoria do jogo, uma invenção do matemático John von Neumann (1903-1957). Von Neumann, um prodigioso húngaro que se estabeleceu nos EUA, ajudou a desenvolver a bomba-A e, entre outras realizações, inventou o computador digital. Ele também amava os jogos de estratégia, especialmente pôquer e xadrez, e lá pelos anos de 1920 e 1930, desenvolveu uma teoria matemática para descrever suas estruturas. Von Neumann fez isso, de certo modo, para melhor entender os jogos, mas principalmente porque acreditava que a teoria do jogo poderia prover uma base científica para o estudo de situações similares em outros campos. Ele cunhou o termo "teoria do jogo" em The Theory of Games and Economic Behavior (1944, com Oskar Morgenstern). O comportamento econômico é um "jogo", no sentido mais amplo dado por Neumann: uma situação definida por interesses competitivos, em que cada um procura maximizar seus ganhos.
A teoria do jogo foi um fracasso para os economistas, mas terminou sendo útil para outras áreas. Depois da Segunda Guerra, Neumann foi contratado pela Rand Corporation, onde aplicou a teoria do jogo mais produtivamente na estratégia da Guerra Fria. Recue no tempo até os anos cinqüenta e imagine-se tendo que decidir se os Estados Unidos deveriam construir um arsenal de bombas-H. Vamos supor que a União Soviética, o "inimigo", seja perfeitamente capaz de fazer o mesmo. Suas possíveis escolhas são duas: construir o arsenal ou não construir. Existem quatro resultados possíveis:

1. Nem os EUA nem a URSS constroem um arsenal — o status quo é preservado.

· 2. Os USA constroem um arsenal mas a URSS, não — os EUA ficam em posição de potencialmente destruir a União Soviética e dominar o mundo.

· 3. A URSS constrói um arsenal mas os EUA, não — os soviéticos ficam em posição de potencialmente destruir os USA e dominar o mundo.

· 4. USA e URSS constroem arsenais — uma corrida armamentista, nenhum lado domina, muito dinheiro é gasto e o mundo inteiro agora encara a possibilidade de uma devastadora guerra nuclear.

Se você analisar esse "jogo", vai constatar que é um tipo de dilema do prisioneiro. Não importa o que a URSS faça, a melhor vantagem para os EUA é construir bombas. (Se ela não o fizer, os EUA se tornarão o poder mundial supremo; se ela o fizer, os EUA, pelo menos, ficam empatados com ela.) Mas, se os soviéticos chegarem à mesma conclusão, ambos irão gastar toneladas de dinheiro só para manter o equilíbrio de poder, enquanto acumulam estoques de matéria-prima radioativa. O resultado ideal seria a "cooperação": cada lado se refrear (possibilidade I). Mas você confia no outro lado? No final, nenhum dos dois confiou.
Embora von Neumann tenha iniciado a teoria do jogo na Rand, não foi ele quem descobriu o dilema do prisioneiro nem foi ele quem estudou suas implicações. Von Neumann concentrou-se quase que exclusivamente no que chamou de "jogos de tudo-ou-nada". Nestes jogos, o total da remuneração é fixo, e o que um adversário ganha é necessariamente o que o outro perde. A maioria dos jogos de mesa, por exemplo, são tudo-ou-nada: se o seu adversário vence, você perde. O pôquer também é um tudo-ou-nada: o vencedor leva tudo.

Um dos colegas de Neumann na Rand, John Nash, (John Nash , biografia de Sylvia Nasar em 1998 e filme “ Uma mente brilhante” com Russel Crowe, no papel de John Nash, vencedor do Oscar de 2001) ampliou a teoria do jogo para abranger os jogos entre duas pessoas que não são tudo-ou-nada. Sua teoria era que, em tais jogos, existe sempre um "ponto de equilíbrio": uma vez que seu adversário não vai mudar de estratégia, você também não muda. Tomemos esse jogo como um exemplo:

	K escolhe cara	K escolhe coroa
Você escolhe cara	você ganha $ 1	você *perde* $ 1
	K ganha $ 3	K ganha $ 4
Você escolhe coroa	você ganha $ 2	você ganha $ 1
	K não ganha nada	K ganha $ 2

Neste jogo, o "ponto de equilíbrio" está na jogada coroa/coroa (bloco inferior direito). Isto acontece porque, a despeito do que K faça, é sempre vantajoso para você escolher coroa, e o mesmo vale para K. E mesmo se K tivesse tido a chance de mudar sua estratégia, você ainda assim escolheria coroa, e vice-versa.

O que Nash não percebeu a princípio, ou só veio a aceitar depois, é que o simples fato de existir um ponto de equilíbrio não quer dizer que, nos jogos da vida real, as pessoas vão escolhê-lo. É o que acontece especialmente nos casos de jogos "reiterativos"— jogos entre dois ou mais jogadores, que são repetidos vezes e vezes, com as mesmas estratégias e a mesma remuneração.

Vamos analisar de novo o dilema do prisioneiro, que foi basicamente descoberto por dois outros cientistas de RAND, Merrill Flood e Melvin Dresher, em 1950. (Eles descobriram a forma do jogo; depois, foram introduzidos os prisioneiros e o dilema foi batizado, no final daquele ano, por Albert Tucker.)

O ponto de equilíbrio é a defecção mútua: dado que seu parceiro/adversário escolheu a estratégia, e que ela não pode ser mudada, você está sempre em melhor situação se defectar.
Porém, vamos supor que você e seu oponente joguem um jogo do tipo do dilema do prisioneiro centenas de vezes seguidas.

Digamos que os ganhos sejam os seguintes:

	K coopera	K defecta
Você coopera	$ 2 para você	$ 0 para você
	$ 3 para K	$ 4 para K
Você defecta	$ 3 para você	$ 1 para você
	$ 1 para K	$ 2 para K

Não importa o que K faça, você se sairá sempre melhor defectando — você sempre ganhará um dólar a mais. O mesmo vale para K: não importa o que você faça, ele sempre ganhará um dólar a mais defectando.

Porém, a cooperação mútua é melhor para ambos do que a defecção mútua; o pior cenário para você é cooperar enquanto K defecta.

Se esse jogo fosse de somente uma rodada, e você e K não pudessem ter estratégias de antemão, então a coisa a fazer seria defectar, já que você não conhece a estratégia de K e não pode mudá-la. Mas em um jogo repetitivo, as coisas são bem diferentes.

Digamos que K decida cooperar, esperando que você também o faça, garantindo o melhor resultado mútuo. Você, por outro lado, segue a lógica do jogo de uma só rodada e defecta. Você ganha uma bolada ($3), enquanto K recebe sua menor soma possível ($1) e, assim sendo, na próxima vez K decide "puni-lo", defectando por sua vez. Ao defectar, K está basicamente tirando de você os dois dólares — duas vezes o lucro extra que você ganhou ao defectar a primeira vez.

Portanto, embora defectar seja seguro, você poderia potencialmente ganhar muito mais dinheiro se você e K cooperassem. É claro que, se K cooperasse a cada rodada em que você decidisse defectar, você terminaria com um ganho máximo de $300. Mas se K for racional, ele reagirá defectando também toda vez que você defectar, ganhando $100 a mais do que ganharia se cooperasse em cada jogada. Qual é, então, a melhor estratégia?

A teoria do jogo, graças à ajuda de modelos feitos por computadores, tem a resposta: é o chamado "olho por olho". Você começa cooperando. Se K também cooperar, você coopera novamente na segunda rodada. E continua a cooperar até o ponto em que K defecta, e nesse ponto você o "castiga" defectando na rodada seguinte. A razão pela qual essa estratégia funciona é que você está usando o jogo para mandar uma mensagem a K: "Eu vou fazer sempre o que você fez na última rodada; e como você nunca vai se beneficiar de minha defecção, você deve sempre cooperar comigo, garantindo o melhor resultado para ambos". Em outras palavras, você está convidando-a para se unir a você e ambos jogarem contra o próprio jogo, em vez de cada um jogar contra o outro.

Na vida real, "olho por olho" significar tratar as outras pessoas da mesma maneira que elas tratam você, mas sempre agindo da melhor maneira no início. Furar uma fila pode ser ótimo para você, mas é ruim para todos os outros e, se eles respondessem na mesma moeda, seria o caos, com socos saindo de todos os lados.

Da mesma forma, todo mundo se beneficia quando você faz uma doação de sangue. Você pode até vir a usufruir desse benefício sem nunca ter doado, mas, se todo mundo agisse dessa forma, não haveria um banco de sangue. Claro, não adiantaria cooperar se ninguém mais o fizesse; mas, como todo mundo percebe isso, e ninguém gosta do caos, a maioria das pessoas coopera de fato.

Existe um outro dilema da teoria do jogo que também encontramos na prática. Ele é chamado de "galinha", nome cunhado por Bertrand Russell, acredite você, ou não. É o seguinte: você e um amigo montam em suas bicicletas e pedalam até às bordas de um despenhadeiro.

O primeiro a parar ou a mudar de rumo é a "galinha". Se ambos pararem ("cooperarem") simultaneamente, então ninguém é a "galinha", mas também ninguém vence.

O melhor resultado para você será se seu amigo parar primeiro: você vai vencer e ele vai ser a "galinha". O pior resultado para ambos é se nem ele nem você pararem — isto é, se os dois "defectarem": ambos cairão no precipício. O que você faz? (Este jogo difere do dilema do prisioneiro no fato de que a mútua defecção é o pior para ambas as partes.)

Como você deve ter notado, a teoria do jogo — embora matematicamente rigorosa — ainda não resolveu todos os conflitos humanos.

Em primeiro lugar, para a teoria funcionar, tem que estar claro quem são todos os jogadores, e o rateio deve poder ser expresso em números (ou, pelo menos, em probabilidades). Esse não é sempre o caso nos jogos complicados da política ou da sociedade.

Segundo, definir o que constitui "cooperação" ou "defecção" pode ser bastante complicado — existem muitos casos intermediários na vida real, e os adversários tendem a não concordar com os termos (o que parece bom para um pode não satisfazer o outro).

Apesar de tudo, sempre é melhor ter ferramentas do que não ter, e a teoria do jogo é uma ferramenta notável e interessante, com aplicações reais na física, na ética, na engenharia e até mesmo na biologia. A evolução das espécies, por exemplo, pode ser entendida em termos de teoria do jogo, mas essa é uma outra e longa estória.

Backup

sexta-feira, 10 de outubro de 2008

Teoria dos Jogos: descomplicando

Nenhum comentário:

Postar um comentário