DILEMA dos PRISIONEIROS e o EQUILÍBRIO de NASH

60.38k views2082 WordsCopy TextShare
Tem Ciência
Como funciona matematicamente uma delação premiada? O Dilema dos Prisioneiros e o Equilíbrio de Nash...
Video Transcript:
hoje é dia de falar no equilíbrio de Nash um conceito revolucionário que mudou para sempre a teoria de jogos e rendeu o prêmio Nobel a um dos matemáticos mais brilhantes do século 20 Olá meu nome é Daniel Nunes você está no tem ciência e hoje nós vamos falar de uma ideia do John Nash o matemático genial que foi retratado no filme Uma Mente Brilhante e que também foi a primeira e única pessoa até hoje a ganhar o prêmio Nobel e a medalha a Bel o México Fez muitas coisas na vida mas hoje a gente vai
falar sobre o que ele fez durante seu doutorado em brainston Aliás a sua carta de recomendação para entrar no doutorado tinha apenas uma linha que dizia simplesmente este homem é um gênio pois bem em princeton Nash desenvolveu um trabalho que revolucionou a teoria de jogos uma área da matemática com inúmeras aplicações especialmente em economia mas o que que é um jogo para matemática um jogo é uma situação de interação estratégica entre agentes podem ser pessoas animais governos empresas qualquer coisa O importante um jogo é que ele dá um resultado para cada um dos seus participantes
dependendo do que cada um faz por exemplo no jogo de concorrência entre empresas o é o lucro que cada uma delas obtém O Grande Lance é que o resultado que um agente recebe no jogo depende tanto daquilo que Ele escolhe fazer como também do que os demais agentes escolhem fazer ou seja as suas ações influenciam no seu resultado e também no resultado das demais pessoas e vice-versa tudo junto e misturado então o conceito de jogo na teoria de jogos é bem amplo e serve para modelar uma infinidade de interações estratégicas mas onde que entra o
net nessa história bem antes do Nash a teoria de jogos tinha sido desenvolvida pelo Johnson neuer mas estava basicamente limitada a jogos entre apenas duas pessoas e em situações de escola zero ou seja o que um ganha é exatamente o que o outro perde essa situação é muito restrita tem muito poucas aplicações práticas até que veio Nash que chegou chutando a porta com seus pouco mais de 20 anos de idade e revolucionou tudo com seu conceito de Equilíbrio que depois ficou conhecido como o equilíbrio de Nash o Next expandiu a Teoria para jogos com o
número arbitrário de pessoas e que também não precisava mais ser um jogo de soma zero ele encontrou uma definição adequada de equilíbrio para jogos muito mais Gerais que foi o seu equilíbrio de Nash E ainda por cima provou que todo jogo finito tinha um ponto de equilíbrio ele fez isso usando um teorema de ponto fixo que era uma novidade na época e tudo isso aconteceu quando mexe ainda estava no doutorado e 45 anos depois ele ganhou um prêmio Nobel em economia por conta dessas ideias a ideia de equilíbrio de Nash transcende a própria teoria de
jogos influenciou outros trabalhos em economia como por exemplo a teoria do equilíbrio Geral de Arrow e Hebreu que é claramente inspirada nas ideias do Nash que também rendeu um prêmio Nobel Mas afinal o que é um equilíbrio de Nash no jogo não cooperativo um equilíbrio é uma situação na qual cada jogador escolheu uma estratégia mas para nenhum jogador É vantajoso mudar de estratégia desde que os demais permaneçam seguindo a sua estratégia de Equilíbrio eu sei que dizendo dessa forma pode ser um pouco confuso mas a ideia é que o equilíbrio de Nash é uma situação
em que ninguém tem incentivo para mudar de estratégia Qualquer mudança leva o agente para uma situação pior ou pelo menos igual mudar não é vantagem a melhor forma de entender o equilíbrio de Nash é como exemplo e o exemplo mais famoso em teoria de jogos é o dilema dos prisioneiros que é o seguinte Imagine que a polícia capturou dois suspeitos praticaram um crime a polícia sabe que eles cometeram um crime que pode dar uma pena de até 20 anos de prisão O problema é que os policiais não tem prova suficientes como a condenação completa as
provas que a polícia possui são suficientes apenas para uma condenação por um ano de cadeia então a polícia decide usar a ideia da delação premiada da seguinte maneira os policiais vão interrogar cara suspeitos separadamente um não sabe que o outro vai dizer desse interrogatório a polícia pede a colaboração do investigado que Pode confessar o crime ou permanecer calar os investigadores abrem o jogo eles falam para os primeiros suspeito Olha a gente quer contar com a sua colaboração e se você colaborar será recompensado Nós também vamos interrogar o seu colega e oferecer a mesma chance de
confessar ou escalar Lembrando que os interrugados não sabem que o outro vai fazer a proposta para o interrogado é a seguinte se você escalar e o seu amigo também então temos prova suficiente para manter os dois presos por um ano se você colaborar entregando o esquema o seu amigo ficar lá então você vai ser beneficiado pela delação e vai ficar livre amanhã mesmo Enquanto seu amigo será condenado por 20 anos de prisão agora se você escalar e o seu amigo dela tá quem fica livre é e você que será condenado a 20 anos de cadeia
por fim se vocês dois resolverem confessar então nós reduzimos apenas dos dois mas ainda vão ter que ficar presos por cinco anos essa é a situação explicada para cada um dos interrogados Lembrando que eles são interrogados separadamente em um não sabe que o outro vai fazer numa situação dessas O que que você faria caso fosse um dos interrogados essa é uma típica situação de teoria de jogos O que o resultado das ações de cada jogador que no caso aqui são os prisioneiros depende não só da sua própria escolha mas também na escolha do outro jogador
então o segredo para decidir está em levar em conta que o outro pode fazer e vem a partir daí qual é a melhor estratégia você não tem como saber o que o seu amigo realmente vai fazer mas vamos imaginar que ele escolha confessar o creme que vocês praticaram nesse caso se você tiver escolhido ficar calado isso vai fazer você pegar a pena máxima de 20 anos e é terrível então Nessa situação a sua melhor escolha teria sido confessar também creme por outro lado imagina que seu parceiro vai ficar calado se você também fica calado Então
os dois vão pegar um ano de cadeia não é tão ruim mas dá para ficar melhor porque se você tivesse escolhido confessar Então seria compensado pela delação e ficaria livre enquanto seu parceiro é quem ficaria preso por 20 anos ou seja repare que não importa com seu amigo decida fazer você sempre estará em melhor situação escolhendo confessar o creme matemáticamente a gente disse que confessar é uma estratégia dominante É lógico que o seu parceiro também Chega nessa mesma conclusão portanto mais racional individualmente para vocês dois é justamente ambos conversarem Esse é o equilíbrio de Nexo
do dilema dos prisioneiros já que nenhum dos dois tem incentivo para desviar da estratégia de confissão se o seu parceiro confessar Mas você decidir ficar calado a sua pena aumenta para 20 anos então o melhor é permanecer no equilíbrio genético e confessar a mesma coisa vale para o seu parceiro agora o mais interessante nisso tudo é que o equilíbrio de Nash do dilema dos prisioneiros conduz a uma solução que não é a melhor para os dois olhando para as opções se pensarmos no conjunto da soma das penas o melhor seria ambos ficarem calados e pegarem
cada um um ano de cadeia mas você confiaria que o seu parceiro realmente ficaria calado o grande problema é que a estratégia que ambos ficam calados não é um equilíbrio de Nash Pois cada jogador teria um incentivo para mudar de estratégia e delatar sempre que o outro escolhesse ficar calado assim ele sai livre no dia seguinte Enquanto o outro cumpre a totalidade da pena Esse é um aspecto interessante do equilíbrio de Nash ele não necessariamente vai conduzir a melhor situação para os jogadores isso claramente é o que acontece no dilema dos prisioneiros o equilíbrio acontece
no ponto pior para os dois Olha só uma coisa interessante o dilema dos prisioneiros é um exemplo de uma situação na qual comportamento racional individual conduz a uma situação de irracionalidade Coletiva Isso já é interessante nesse exemplo hipotético mas imagina isso sendo aplicado a guerras comerciais boas situações de emissão excessiva de gases poluentes Por parte dos países uma situação muito parecida com dilema dos prisioneiros pode ser imaginada entre duas empresas concorrentes a decisão aqui é entre abaixar os preços ou não se uma empresa abaixo o preço e a outra não ela atrai mais clientes e
isso compensa redução dos preços fazendo seu lucro crescer sem ambas abaixam preço porém elas vão manter os mesmo clientes isso vai fazer o seu lucro diminuir por fim se nenhuma empresa deve desconto Então os lucros se mantém um nível atual a situação Idêntica do dilema dos prisioneiros e o equilíbrio de Nash aqui é ambas as empresas a baixarem os preços porque vai levar uma queda nos lucros das duas empresas isso é bom para os consumidores mas ruim para as próprias empresas claramente é melhor escolha para as empresas seria elas combinarem de não dar descontos Só
que nesse caso a gente deixaria de ter um jogo não cooperativo para ter um jogo de cooperação que vai deixar consumidores em situação pior é por isso que esse tipo de prática é proibida pela legislação de trust evitar que empresas com virem preços em prejuízos dos consumidores Aliás o conceito de equilíbrio de Nash é usado também para nortear as políticas de proteção da concorrência eu queria fechar esse vídeo lembrando de uma cena do filme Uma Mente Brilhante que na primeira parte retrata justamente o doutorado do Nash em Priston onde ele descobriu o seu famoso equilíbrio
a cena acontece num bar e o Next explica para os seus colegas uma situação que gerou um Insight para sua descoberta é o seguinte os seus amigos estão à procura de garotas para ficar no bar tem uma garota loira que é mais bonita de todas mas também existem outras garotas morenas os homens ali gostariam de ficar com a loira preferencialmente Mas neste diz que se todos eles tentarem ficar com a loira ninguém vai conseguir pois um vai ficar bloqueando o outro aí eles acabariam tendo que ficar com as amigas morenas Mas isso não daria certo
pois ninguém gosta de ser a segunda opção O resultado é que se todos forem na loira vão terminar a noite sem ninguém só que e Se ninguém for na loira se todos forem nas amigas morenas então elas vão se sentir lisonjeadas vão topar ficar com eles aí todos saem felizes e conseguem terminar a noite com uma garota nas termina a cena dizendo que esse é um exemplo de uma situação em que o melhor resultado vem de cada um fazer o melhor para si e para o grupo não apenas o melhor para si bem o que
ele disse Está correto mas o problema é que essa situação de todos irem nas morenas não é um equilíbrio de Nash se a ideia da cena é na Moção em site da descoberta do equilíbrio bem acabou ficando numa cena sem sentido porque ela não traz um ponto de equilíbrio Mas por que não bom lembra que no ponto de equilíbrio de Nash nenhum jogador tem incentivo para mudar de estratégia agora se todos os amigos estão indo nas morenas vale a pena você mudar estratégia em namoro já que ela é a mais bonita de todas ou seja
desviar da estratégia de ir na morena leva você uma situação melhor portanto e na morena não é o equilíbrio de Nexo eu achei isso não tremendo furo Mas eu continuo sendo esse filme Até porque ele foi uma das primeiras influências que eu tive na vida para escolher ser um matemático então é proibido falar esse filme aqui no canal e se você nunca viu veja e não se esqueça de deixar o like se inscrever e até o próximo vídeo
Copyright © 2025. Made with ♥ in London by YTScribe.com