O dilema do prisioneiro

26.72k views2154 WordsCopy TextShare
Professor Possani
Este vídeo contém um primeiro exemplo de um problema que é estudado em Teoria dos Jogos: O dilema do...
Video Transcript:
[Música] [Música] olá caríssimos bem-vindos ao canal vou fazer um vídeo de vertidíssimo muito interessante eu Dilema do Prisioneiro isso é um clássico dentro de uma área da matemática que é muito pouco estudada na Educação Básica não é nada estudada e mesmo nos níveis de graduação isso só é estudado em poucos cursos no nível de cursos de Economia administração talvez Engenharia de Produção eu sou muito poucos os cursos mesmo na área de exatas que estudam isso curso de informática de computação Ciência da Computação que a teoria dos jogos então O Dilema do Prisioneiro é um exemplo
dentro da teoria dos jogos que ilustra bem a riqueza dessa teoria ele é quase que uma anedota é uma espécie de historinha em que o que eu vou contar para vocês e às vezes já ouvi de algum logo no começo assim quando eu começo a explicar Ele fala Ah mas isso é muito irreal isso é muito artificial depois eu volto para falar de como que isso é real tá no finzinho eu falo a formulação como prisioneiros com essas regrinhas que eu vou mostrar ela ficou clássica e ela ajuda a gente a pensar porque ela gera
uma intuição né bem fácil de acompanhar mas antes de apresentar a teoria dos jogos é super importante e isso significa quando nós O que quer dizer um jogo nesse caso é uma situação em que você tem duas ou mais pessoas e que estão procurando a estratégia ótima a estratégia ótima é a estratégia que maximiza o seu ganho numa determinada competição e isso depois eu comento com mais detalhes pode ser usado em um monte de áreas do conhecimento de Economia a matemática pura Então isso que é o que a gente chama de teoria dos jogos o
dilema dos prisioneiros é o seguinte exemplo então dois suspeitos de um crime são presos e o delegado que está investigando sabe um monte de coisas mas não sabe tudo e ele tá querendo negociar com os prisioneiros por isso que chama dilema dos prisioneiros um eventual cooperação dos prisioneiros Então esquece se a regra é real no mundo da Justiça Vamos só para usar para como exemplo de raciocínio a regra do Delegado é a seguinte se ambos se calarem ele não consegue provar muita coisa ele tem lá um pouco de provas mas ele não consegue muito para
frente então ele é obrigado a soltar os dois com uma pena muito pequena cada um vai ter que pegar um ano de prisão e Apenas não é grande porque o delegado tem poucas provas em mãos se um ficar calado e o outro confessar o outro entregar todo o esquema aí o delegado dá um prêmio para o que confessou o que confessou ficar livre e a pena vai pesada em cima do outro o que não cooperou com a justiça paga um preço alto e o que cooperou fica livre e isso é simétrico para cada um dos
dois se o acala o b confessa o b sai livre e o a pega uma pena pesada se o ar confessa Coopera com a justiça e o b Se Cala o a fica livre e o b pega 10 anos simétrico e se ambos confessarem se ambos confessarem o delegado vai ter várias provas várias evidências contra ele não pode deixá-los totalmente soltos então cada um vai pegar uma pena de 5 anos menor que a pena mais pesada de 10 porque afinal eles cooperaram e o delegado reduz um pouco a pena os prisioneiros não se comunicam o
delegado colocou cada um numa cela e eles não tem comunicação entre si e chama Dilema do Prisioneiro porque agora vem a pergunta qual é a melhor estratégia para cada Prisioneiro Essas são as regras do jogo Então isso é fundamental que não há comunicação olha a visão do prisioneiro A então Prisioneiro a sabe de todas essas regras não tem contato com o b e o Prisioneiro a começa a pensar e ele pensa assim o meu parceiro vai ficar calado ou vai confessar eu não sei se ele ficar calado eu também ficar calado então é o a
pensando se o meu parceiro ficar calado e eu ficar calado cada um pega um ano o ar não tá preocupado com a pena do B O A tá preocupado com a sua própria penalidade quer se livrar que é maximizar o seu ganho que é ter o menor o menor tempo de prisão possível aí o ar Continua pensando se o b ficar calado e eu confessar aí eu não tenho prisão nenhuma eu sou livre interessante aí o ar Continua pensando isso é a visão do ar o a cultura pensando mas se o meu parceiro confessar bom
se ele confessar colaborar com a justiça e eu ficar calado eu você o cara que não Coopera se o beco opera e eu não eu pego 10 anos esse é o raciocínio do ar e o raciocínio do ar bom se o meu parceiro confessar Colaborar eu também vou colaborar que aí eu pego cinco anos Então essa é a matriz de penalidade do a matriz de penalidade do B é absolutamente igual e simétrica o b faz o mesmo raciocínio e o que é uma estratégia ótima aqui é ter o menor a menor punição possível então agora
vou fazer uma coisa que é um teorema de matemática vou demonstrar um teorema de matemática vou demonstrar o seguinte teorema o Atala sozinho pensando teorema a melhor estratégia para o ar é confessar vou demonstrar esse teorema e o b vai fazer o mesmo raciocínio então Vamos demonstrar o teorema melhor estratégia para o ar é confessar demonstração o A tá na célula sozinho ele pensa bom tem duas possibilidades ou o meu parceiro vai ficar calado ele vai confessar se ele ficar calado e eu posso calar ou confessar se ele ficar calado ia ficar calado eu ganho
um se ele ficar falar Calado e eu confessar eu ganho zero então supondo que o outro fique calado o melhor para o ar é confessar que é o que diminui a pena do ar mas lá não sabe se o b vai ficar calado o b Pode confessar mas se o b confessar e o ar fica calado ele ganha 10 e se o b confessar ele confessar também ele ganha cinco então Qualquer que seja a decisão do b a pena do a é menor se o a confessar líquido aqui na tabela né Para onde está apontando
a flecha de crescimento então lá pensa isso eu não sei o que o b vai fazer o berço cala é melhor eu confessar o b confessa é melhor eu confessar então o que que o a decide vou confessar o delegado armou bem a estratégia e o a decide confessar o b tá na cela ao lado sozinho sem conversar com a faz um raciocínio exatamente simétrico a esse equivalente a esse e o B também decide confessar então teorema dadas estas regras que faz o a que faz o b para melhorar o seu desempenho confessa então ambos
confesso E aí cada um pega cinco anos vai ter alguma coisa errada nisso né eu acabei de demonstrar que o melhor era confessar mas espera aí se os dois ficaram calar calados eles pegam um ano Como assim eu demonstrei que o melhor pro ar é confessar quero ver se calha eu quero ver confesse o melhor para o ar é confessar Então lá vai confessar o b vai fazer uma raciocínio e o b vai confessar ambos vão pegar cinco anos quando eles tinham uma estratégia para pegar um alguma coisa esquisita aqui eu demonstro que a melhor
estratégia é confessar ambos confessam ambos pegam cinco Mas tem uma estratégia que é não confessar nenhum dos dois eles pegam um ano só então vou fazer alguns comentários sobre que tá acontecendo aqui existem dois tipos de jogos jogos de soma Zero e os jogos que não são de soma zero esse não é de soma zero que que é um jogo de soma Zero jogo de soma zero é aquilo que eu ganho é o que o outro perde então apostas em geral uma mesa de poker é um jogo de soma zero porque as pessoas apostam se
eu ganhar eu ganho o quê eu ganho exatamente o que o meu adversário tá perdendo isso é um jogo de soma zero um jogo de soma não zero é quando aquilo que eu ganho não é o que o adversário perdeu eu posso ganhar mais ou menos do que o adversário perdeu por exemplo o futebol quando as partidas valiam dois pontos há muitos anos atrás era um jogo de somas zero porque tinha uma partida Se o time ia ganhar se ele ficava com dois pontos e o b perdia dois pontos só que agora a regra já
Faz muitos anos que mudou a partir da Vale 3 se o ar ganha ele fica com três e o b perde 3 Mas se a partida empata o ar ganha um e o B também ganha um Então olha só se a partida empata o a ganha um e o b o b perde 2 porque o b poderia ter três e o b não tem três Ele só tem um se a partida empata tem um ponto que não é distribuído para nenhum dos dois e a isso é um jogo que não é de soma zero na
teoria dos jogos tem um conceito super importante que é o conceito de equilíbrio de Nash que é que discute Exatamente isso quando que um jogador se ele consegue melhorar o seu ganho por iniciativa própria ou se ele depende do outro para melhorar seu bem que que aconteceu aqui por que que o meu raciocínio me levou para uma conclusão que não é a melhor porque não há comunicação Então veja só não havendo comunicação a melhor estratégia para cada um deles é confessar e cada um pega cinco anos se houvesse comunicação entre eles eles podiam combinar que
ambos vão se calar se calar é correr risco veja só se o a se cala ele corre o risco de pegar 10 mas se ele combina com o B antes e ambos ficaram ambos pegam um que é a melhor estratégia mas isso depende de ter comunicação essa teoria dos jogos ela é estudada como uma coisa interdisciplinar inclusive envolvendo economia administração psicologia porque Ah então se tem comunicação ambos se casa depende porque daí tem que ter confiança no seu parceiro E aí entra uma componente não matemático teoria dos jogos é muito rica porque ela envolve inclusive
aspectos na matemática Ah mas é tudo só uma brincadeira aí de de Prisioneiro a brincadeira lógica não situações reais em que exatamente essa mesma estrutura uma que também não é dramática dois carros estão numa rua muito apertada e um tem que dar vez para o outro Exatamente isso os dois podem dar a vez é um mundo né da gentileza ou um da vez e o outro não o que deu a vez sai perdendo porque o outro ganha tempo e ele fica parado né a gente considera isso um trânsito muitas vezes como perder né E se
nenhum dos dois para aí é pior coisa porque eles batem E aí o prejuízo é máximo Então mesmo estrutura em economia isso é usado o tempo inteiro disputa entre empresas Ah se eu faço se uma empresa faz publicidade ou não depende do que a concorrente faz a concorrente também pode fazer publicidade ou não E aí se uma faz e a outra não faz a que fez tem um grande ganho se ambas fazem tem um equilíbrio e se nenhuma faz também tem um equilíbrio outro exemplo a corrida armamentista dois países vizinhos e que são inimigos Qual
a melhor estratégia gastar dinheiro em arma ou não se ambos gastam dinheiro em arma ficam equilíbrio mas não é o equilíbrio bom porque ambos gastaram dinheiro em armamento eles Teria sido melhor para eles usar o dinheiro para resolver outros problemas do país se nenhum dos dois gasta em armamento que é equivalente aos dois ficarem calados ótimo é o melhor dos mundos porque para os dois sobre o dinheiro sob o orçamento para investir em coisas mais importantes do que armas mas se um não se arma e o outro se arma e como eles são vizinhos e
beligerantes o que tá armado invade o outro e aí aquele que não se armou sai perdendo e reciprocamente né então a quantidade de exemplos onde teoria dos jogos é real e é usado é menor e o dilema dos prisioneiros é um belo exemplo de jogo que não é de soma zero legal
Copyright © 2024. Made with ♥ in London by YTScribe.com