[Música] Olá novamente pessoal na aula de hoje a gente encerra o assunto de variáveis aleatórias discretas nessa décima primeira aula do nosso curso de estatística e probabilidade Nossa disciplina Hoje a gente vai ver alguns exemplos resolvidos envolvendo variáveis aleatórias discretas duas ou três aplicações típicas e as contas como que a gente faz conta na prática usando variável aleatória discreta assim como a gente fez com aquela resolução de probleminha lá de probabilidade a gente vai hoje usar variáveis aleatórias para estudar alguns problemas típicos vamos lá nosso primeiro exemplo é usando a distribuição binomial Vamos pensar num
canal de comunicação digital como ruído que possui um por cento de probabilidade de transmitir um bit incorretamente um canal de comunicação digital pega um sinal um vídeo quando a gente assiste um vídeo na televisão digital ou quando a gente fala no celular nossa voz é gravada é gravada não ela é digitalizada e transmitida seja pelas ondas do ar pelo rádio por uma fibra ótica ela é transmitida no formato de um stream né uma sequência de bits nesse processo de codificação e transmissão os bits podem ser transmitidos erradamente incorretamente Então esse canal aqui do nosso exemplo
tem 1% de probabilidade de pegar um ambiente que deveria ser zero e transmitir como um ou vice-versa né então eu quero saber a probabilidade de observar mais de um erro num bloco de 16 bits Tá bom então a gente vai modelar esse problema como uma variável aleatória o número de bits incorretos a gente vai modelar como uma variável aleatória discreta como a distribuição binomial de parâmetros n = 16 ou seja vou estar olhando para blocos de 16 bits e a probabilidade de cada um deles está errada é 0,01 né 1% Lembrando que o termo geral
de uma distribuição binomial é esse aí a probabilidade de x que para a gente é o número de bits incorretos valecar é dado por isso aí onde n é 16 e p 0,01 né nessa nossa escolha de variável binomial para modelar esse bloco né o número de ocorrências de bits incorretos tá implícita a Assunção de que esses bits podem ser transmitidos incorretamente de maneira independente né o fato de que este está errado o fato de que algum bit está errado não não é correlacionado não depende do anterior Tá certo ou não e o próximo também
não depende dele eu tô olhando simplesmente para um stream de Beats dividindo em blocos de tamanho 16 e fazendo a pergunta a cada 16 bits quantos que eu devo esperar que vão estar errado qual a probabilidade de observar mais de um né então vamos lá a gente usou a distribuição binomial modelo a probabilidade de transmitir mais de um bit corretamente é p de X maior que 1 Só que essa variável aleatória discreta ela só assume valor e zero um dois então C maior do que um é mesma coisa que ser maior ou igual a 2
né pessoal então eu tenho lá a probabilidade de observar mais de um Beat transmitir incorretamente é a probabilidade de eu ter x maior ou igual a 2 que a probabilidade de C2 ou 3 ou 4 ou 5 até 16 Então essa soma que a gente tá vendo aqui a direita é a soma de das probabilidades de um número de erros valer de dois até 16 bom se eu colocar lá o termo geral da distribuição binomial nessa soma eu tenho essa soma que tá aí olha a probabilidade do número de erros é maior ou igual a
dois é o somatório dos coeficientes binomiais 16 k k 001 elevado a k que a probabilidade de observar erros e observe e a probabilidade de observar 16 menos k corretos né que é o 099 bom essa soma aí dá para fazer mas ela é uma soma com um monte de termo Tá certo tem 15 termos aí para serem somados 2 3 4 5 até 16 vou ter que fazer 16 continhas só que se a gente lembrar que a probabilidade de Total vale um então a probabilidade de ser maior ou igual a 2 é 1 menos
a probabilidade vale zero ou um que essa última expressão aí e aí é mais fácil de calcular né Vamos ver quanto dá fiz essa conta aí a gente descobre que a probabilidade do número de bits incorretos transmitidos nesse canal aí de comunicação né em que a probabilidade de erro é um por cento olha pessoal 1% é uma probabilidade enorme Tá certo Jamais isso poderia funcionar na prática mas nesse nosso exemplo aqui essa probabilidade vale 0,0109 mais um monte de casas decimais aí porque tem esses números aí né 099 elevado a 16 e elevado a 15
então tem um monte de casa decimal aí mas aproximadamente dá 1,1 o valor esperado do número de bits errados por pacote de 16 bits lembra na distribuição binomial a gente tem que saber isso aí temos que lembrar o valor esperado dessa variável aleatória é n x p n Vale 16 P vale 0,01 então dá 0,16 esse número é isorbitante eu jamais devo usar um canal de comunicação que vai errar um bit em média a cada 100 né que é o que tá dito aí de cada 16 você fala ah mas é pouco né menos do
que um sexto de cada bloco de 16 um sexto de bit vai estar fazendo nenhum quer dizer provavelmente nenhum vai estar errado É mas eu não tô transmitindo só um bloco de 16 bits eu tô trabalhando eu tô transmitindo milhares de megabytes né Então vai ter bit errado para todo lado é esse canal é virtualmente inutilizável para os padrões atuais atualmente a gente trabalha com canais de comunicação com erros da ordem de 10 a menos 8 10 a menos 9 Além disso tem códigos corretores de erro né Vocês já devem ter ouvido falar esses Jackson
que você envia o código o sinal digitalizado junto embutido nele né misturado lá no meio um código corretor de erro que ele verifica os bits que são de sinal e os bits que são do código corretor de erro ver se eles concordam não discordam a partir dessas concordâncias e discordâncias eu consigo corrigir aqueles que o eventualmente tenha transmitido errado tá bom só uma tecnologia sofisticada para tratamento de sinais digitais né Tá bom mas no nosso exemplo aqui a gente tinha em mente o tratamento de uma variável eu uso né de da variável aleatória binomial não
um problema muito simples eu tenho n coisas que podem acontecer independentemente umas das outras Cada uma com uma probabilidade P eu posso falar que o bit transmitido corretamente é sucesso bit transmitido erradamente é fracasso e eu tenho uma distribuição binomial né que é derivada lá da Bernoulli né um monte de ensaios de bernoull e da origem é uma distribuição binomial e o objetivo Desse nosso exemplo aqui foi olhar para ela a gente vai ver agora que na verdade a gente pode a distribuição binomial por uma distribuição de por ação que é uma outra distribuição discreta
que acontece muito né a distribuição de Poá som ela surge como aproximação da distribuição binomial quando o número de [Música] ocorrer o número de eventos abdominal lá é uma binomial de NP né eu tenho n ensaios de bernoull e cada um com probabilidade P de fracasso ou de sucesso Depende o que eu quero olhar quando ele é muito grande e o p é pequeno eu consigo aproximar a distribuição binomial pela de pós com o pai a distribuição de Poção tem um parâmetro só né E aí binomial tem dois então a relação entre o parâmetro de
poa-assom e o parâmetro e os parâmetros da binomial são a gente coloca lambda igual a NP né a vantagem de fazer isso é que essa aproximação é muito boa quando n é grande p é pequena ela é muito boa e eu tô lidando com um único parâmetro né Se eu tiver que encontrar esse parâmetro a partir dos dados experimentais de medições eu tô procurando um parâmetro só não dois né então eu digo Ah vou tratar o meu problema como se essa variável aleatória fosse distribuída de acordo com uma distribuição de Poções não binomial ah mas
ela é binomial Ela é binomial mas a aproximação de Poção é ótima nesses casos a gente vai ver que mesmo no nosso exemplo aí com n = 16 e p = 0,01 aproximação já é ótima tá como é que a gente faz isso bom a gente escreve aquele termo geral lá da descrição binomial né a pro qualidade da variável valecar que é esse nkk P elevado a k 1 - p elevado n - k a gente simplesmente abre esse coeficiente binomial aí o termo lá em cima eu vou escrever como n - 1 tá que
tec tec n - k + 1 Aí teria [Música] dividido por K fatorial né Aí tem um n menos k fatorial em cima e embaixo que eu tô cancelando se a gente abrir aquele coeficiente binomial É isso aí que a gente tem tá bom pois bem agora o que eu vou fazer é multiplicar os dois lados daquela equação lá por um os dois lados não perdão o denominador e o numerador por n elevado a k aqui tá escrito multiplicando ambos os lados mas na verdade a parte de cima e a parte de baixo então eu
divido todo mundo por elevado a k e multiplico todo mundo por ele elevado a k porque daí dá um né então não tô fazendo nada acontece que os n elevado a k em baixo vão dar origem a esses fatores que estão entre parênteses eu coloquei junto com o p ali eu tinha um p elevado a k eu botei o n para dentro virou NP elevado a k tá bom E aí no último termo eu multipliquei dividir por n tá bom ali um menos NP / n Ou seja no último termo não fiz nada os outros
termos eu multipliquei e dividi simultaneamente por n elevado a k por quê Porque agora ele ficou com essa cara aí que que eu posso fazer com essa expressão eu posso fazer o n e virar um número muito grande mantendo o produto NP constante nesse caso eu obtenho esses dois limites aí lembrando pessoal que o limite de um produto de funções contínuas é o produto dos limites então o produto dessa expressão inteira aí que tá em cima quando ele se torna muito grande é o produto dos limites Qual que é o limite daquele termo que tá
ali em cima bom se eu deixar ele entender a um número muito grande eu obter um menos uma coisa muito pequenininha vezes um menos outra coisa pequenininha etc esses termos aí um dois três etc até cá menos uns são números finitos e o n tá crescendo muito então eles vão todos para zero esse produto aí vai para um tá bom e embaixo embaixo eu tenho uma situação meio complicada porque eu tenho o n dentro e eu tenho ele no expoente então eu tô fazendo um número ficar pequeno mas ao mesmo tempo eu tô exponenciando ele
cada vez mais vezes né isso aí bom primeiro eu separo né aquele termo ali eu separo não termo que depende só de n e o outro que depende de cá né só peguei o expoente ali e dividir em duas partes que é isso que tá no meio aí Essa expressão que tá no meio né tá bom e o limite para n tendendo o número muito grande né tendendo ao infinito dessa expressão é o limite do primeiro vezes o limite do segundo Bom o limite do segundo é um pessoal porque o n tá ficando muito grande
um menos uma coisa que tá ficando [Música] muito pequena vai pensar coisa é um elevado a um expoente qualquer um elevado a qualquer coisa que k é um número finito um elevado a k é um Então esse segundo termo aí dá um e o primeiro o primeiro vocês vão reparar que eu transformei NP em lâmina lembra que eu falei n cresce muito p é um número pequeno mas o produto deles é uma constante eu tô chamando essa constante convenientemente de Lambda 1 - lambda dividido por n elevado a n é um limite Fundamental do Cálculo
aquele limite daqui define a função exponencial todo mundo lembra então esse limite aí 1 - lambda é dividido por n elevado a n quando n vai crescendo muito tende a função exponencial do troço que tá lá dentro Que troço que tá lá dentro menos lambda então isso aí vai virar exponencial de menos lâmina então é elevado a menos 1 vezes 1 que é elevado a menos lambda então quando eu pego aquela expressão lá da distribuição binomial faça esse truque de multiplicar e dividir por n elevado a k e toma o limite de n se tornando
um número muito grande desde que eu mantenha n vezes P uma constante eu obtenho então nós obtemos essa expressão aqui né então aquele número lá probabilidade da variável que essa expressão aí da descrição binomial quando eu faço n vezes P constante Mas deixo ele se transformar num número muito grande ela tende para distribuição de isso nos mostra que podemos aproximar a distribuição binomial pela distribuição quando quando ele é grande P pequeno eu tomo lambda como sendo n vezes P veja pessoal eu não preciso sempre fazer ele entendendo infinito eu digo o seguinte eu tenho um
número n muito grande IP é um número pequeno tal que n vezes p é fixo quando isso acontece uma aproximação é aproximadamente semelhante vai vai me dar os mesmos números que a outra tá bom a justificativa a gente viu aqui nas nossas continhas são aqueles dois limites lá tem o limite fundamental vamos usar agora aquela aproximação vamos estimar novamente a probabilidade de observar mais de um erro a cada 16 bits no nosso canal de comunicação lá que tinha 1% de chance de transmitir o bit errado bom não bloco de 16 bits com peido a 0,01
se eu fizer a aproximação de boa ação para aproximasse para distribuição binomial eu obter que lambda vale 0,16 e daí P de X maior ou igual a 2 é a mesma coisa de antes né pessoal em vez de somar até o infinito eu vou pegar um menos aquilo que eu não quero eu não quero zero erros eu não quero um erro eu quero maior igual a dois então é um menos a distribuição como zero que é esse número que tá aí menos o valor né probabilidade desse número vale um que é esse essa constante ela
vai dar menos lambda 1 sobre um fatorial se eu faço essa conta aí dá 0,015 que é quase o mesmo valor encontrado anteriormente lembra a gente encontrou 0,0109 a gente encontrou 1,09% na fazenda isso é o valor supostamente exato dentro da nossa suposição lá né quando eu faço a aproximação de Poção eu encontro o valor 1,15 então eu obtive 1,1% no cálculo com abdominal obtive 1,15% com aproximação de Poções então mesmo quando ele não é muito grande e o p não é muito pequeno 1% não é pequeno certo e n = 16 também não é
muito grande mas mesmo nesses casos a aproximação já é suficientemente boa Tá bom então isso é para a gente ver que essas distribuições discretas muitas vezes guardam relações entre si a gente vai ver mais um caso desse mais para frente quando a gente falar de variáveis aleatórias contínuas a gente vai ver que é possível aproximar a distribuição de binomial novamente por uma distribuição normal uma aproximação normal a distribuição glauciana ela também pode ser usada para aproximar a distribuição binomial quando o n é muito grande os histogramas da distribuição binomial com n muito grande e o
da distribuição normal são muito próximos isso tem a ver com o teorema do limite Central que a gente vai ver também na próxima semana e na outra semana depois que a gente falar de variáveis aleatórias contínuas e essa existem muitas relações entre essas distribuições essa daqui é uma delas é útil e a gente viu como é que se aplica Tá bom então Vimos a aproximação de Poções a gente vai agora olhar o caso de uma um exemplo envolvendo a distribuição geométrica Então em vez de usar um probleminha que envolve a distribuição geométrica por exemplo um
fósforo tem 50% de chance de ser acendido quando eu tento arriscar em média quantas vezes eu devo tentar arriscar esse fósforo que tem 50% de chance só de ser acendida cada vez que o risco todo mundo que já tentou acender fósforo aí sabe que a gente raramente consegue acender na primeira né você Geralmente dá ali umas duas riscadas antes do fósforo pegar fogo para acender uma fogueira um fogão uma churrasqueira Esse é um exemplo de uso de distribuição geométrica né você quer saber qual a probabilidade de fracassar um certo número de vezes antes de obter
sucesso Essa é a essa definição de uma variável aleatória discreta com distribuição geométrica Tá bom a gente vai aqui no nosso exemplo calcular o valor esperado dela bom essa expressão para probabilidade de uma variável aleatória distribuída geometricamente valecar eu tenho k -1 fracasso depois P sucesso e o valor esperado é dado pela expressão geral né essa expressão absolutamente válida essa primeira igualdade aí é definição de valor esperado valor esperado da variável aleatória é a média ponderada dos valores que ela pode assumir então é zero vezes a probabilidade de vale zero mais um vez a probabilidade
de valer um mais dois vezes a probabilidade de vale 2 e assim por diante tá no caso da distribuição geométrica a gente insere ali a expressão geral para p de x = k e obtém isso daí a gente tem que fazer essa soma pessoal essa massoma é uma PG certo P aí tá só tem 1 - p elevado a k - 1 mas o p tá sozinho posso colocar para fora e tenho que fazer essa soma o complicante aqui é a ocorrência desse k só que eu posso aplicar um truque aqui que é um truque
que é justamente que eu queria mostrar para vocês porque ele é muito útil a gente pode escrever a soma como uma derivada Então olha o valor esperado da variável ela para geométrica é p meu botei Já botei aquele P lá que não depende de carro eu tô somando sobrecar tudo que não depende de cá é constante eu coloquei para fora tá certo então aquele P tá ali sozinho ali vezes somatório desse desse negócio a gente olhar para esse somatório Olha tem o k vezes uma coisa elevado a k - 1 isso é uma derivada já
derivada de um termo X elevado a Carla derivada de x elevado a k não é k vezes x elevado a k - 1 derivada de um polinômio derivada de uma potência certo é derivada mais elementar que a gente aprende em cálculo um logo no começo da vida então aqui eu tenho essa expressão reconheço que k vezes um menos P elevado a k - 1 essa derivada presta atenção no sinal de menos ali porque porque quando eu for derivar um menos P eu tenho menos P lá dentro essa você vai ganhar um sinal de menos então
tô compensando o sinal de menos que eu vou ganhar e que ali não tem botando mais um sinal de menos ali para fora tá bom então eu tenho menos P ddp dessa soma ora pessoal essa soma é uma PG né a última soma é soma de uma PG de razão menos p e Vale 1 sobre P só colocar lá né soma vai dar 1 / 1 - a razão a razão é 1 - p então vai ficar 1 / 1 - 1 - p ou seja vai dar um sobre P E aí obtém essa expressão
geral aí o valor esperado da variável aleatória geométrica é menos P ddp de um sobrep de onde que vem esse um sobre P que tá entre parênteses aí é aquela soma da pg ali tá bom E se eu fizer essa derivada multiplica por P multiplica com sinal de menos lá vai dar isso daí então encontrei o valor esperado da variável aleatória distribuída geometricamente fazendo aquela pessoa de PG e os reconhecendo que a soma na verdade é a derivada de uma PG né tá bom esse exemplo que eu dei aqui é ele ele exemplifica ele é
um caso do uso de momento fatorial os momentos de uma variável aleatória seja discreta esteja contínua é o valor esperado de X elevado a k ou résimo momento é o valor esperado da varanda X elevado a r Mas eu posso definir os momentos fatoriais como o x vezes x menos um x menos R - 1 então tem R fatores aí dentro mas o próximo é x - 1 Então em vez de ser x vezes x vezes x r vezes é x vezes x menos 1 vezes x menos dois x menos R + 1 tem R
fatores aí dentro igualmente mas quando eu faço esse essa subtraçãozinha de menos 1 menos 2 para cada fator eu eu chamo isso de momento fatorial Qual a vantagem dos momentos fatoriais é muito mais fácil calcular os momentos fatoriais por causa daquele truque da derivada para muitas distribuições Isso é verdade para distribuição binomial Isso é verdade para distribuição hiper geométrica Isso é verdade para distribuição de Poá som então é preferível nesses casos Ah eu quero calcular o segundo momento ou quero calcular variância né que é uma diferença né é o segundo momento menos o primeiro momento
ao quadrado quando eu quero fazer essas contas É vantajoso usar os momentos fatoriais tá bom porque eles podem ser dados em termos de uma derivada por exemplo no caso da distribuição geométrica o RS no momento fatorial e simplesmente isso aí esse fator que está na frente aí um número P vezes 1 - p elevado a R - 1 vezes aí reza em madeirada de um sobre P então eu deriva que eu quero o segundo momento o R = 2 fica p x 1 - p vezes a segunda derivada de 1 - p que vai dar
menos 2 sobre P Ao Cubo né Aí você faz essa multiplicação aí e obtém o valor do segundo momento da fatorial da variável aleatória E aí você por manipulação algébrica né porque o valor esperado o e de alguma coisa é uma operação linear então ele X + Y é de x + x e y Se você pegar esse momento fatorial e multiplicar todos esses fatores aí também dá um monte de coisa somada uma com a outra separa os vizinhos e a gente consegue fazer essas contas mais facilmente para pôr a sombra geométrica para binomial para
hiper geométrica em particular a variância que é o segundo momento menos o primeiro ao quadrado quando a gente escreve em termos dos momentos fatoriais fica com essa cara aí Tá bom então fica a dica do exemplo de uso de momento fatorial a gente não usou a gente usou implicitamente ali porque era o primeiro momento né era o Ed X né então a gente usou o truque da derivada mas o que tá por trás aí eu uso de momentos fatoriais tá bom pessoal bom como a gente viu o cálculo de probabilidades de eventos e valores esperados
usando variáveis aleatórias discretas é simples a gente só tem que entender o mecanismo de fazer as somas adequadas na próxima semana a gente vai rever esse material desta vez para variáveis aleatórias contínuas das quais a variável aleatória normal ou gaussiana é de suma importância espero vocês até semana que vem [Música] [Música]