Cálculo manual do teste de Kruskal-Wallis (não-paramétrico)

4.4k views3149 WordsCopy TextShare
Fernanda Peres
Nesse vídeo, te explico como calcular manualmente o teste de Kruskal-Wallis, um teste não-paramétric...
Video Transcript:
o Olá pessoal tudo bem esse vai ser um vídeo para a gente discutir Como é feito o cálculo manual teste não-paramétrico de kruskal-wallis o teste de kruskal-wallis o teste que permite que a gente compare as distribuições de mais de dois grupos quando a gente tem só dois grupos dá para usar o teste conhecido como teste de mann-whitney que eu já tenho aqui no canal Mas se a gente tiver mais de dois grupos a gente tem que usar o teste de kruskal-wallis que seria e o correspondente não-paramétrico ao teste anova de uma vida então a gente
vai ver como a gente faz esse tipo de teste a mão e bom então vamos a um exemplo eu vou usar aqui é um exemplo de pressão arterial então que a gente tá vendo aqui então medidas de pressão arterial e milímetros de mercúrio de três grupos diferentes O grupo que recebeu Placebo com que recebeu um anti-hipertensivo novo no mercado e um que recebeu anti-hipertensivo padrão e importante lembrar as cidades são fictícios Ok o teste de kruskal-wallis assim como os outros testes não paramétricos como eu coloco som o medo Whitney e freedman ele não se baseia
no valor obtido em si mas sim de uma coisa que a gente chama de impostos ou em inglês se vai ver isso como o Husky Snapchat então basicamente a gente não vai trabalhar com esses valores de pressão que a gente estava indo aí mas com a posição oposto desses valores de pressão então o primeiro passo para o cálculo do teste de kruskal-wallis e pegar todos os valores que a gente tem e ordená-los de forma que bom então eu fiz isso aí né que céu e colei aqui para facilitar nossa vida Então veja que eu tô
aí com todos os valores de pressão independentemente do grupo organizados de forma crescente do menor até o maior tá então menor era a 116 de maior 188 depois disso que a gente vai fazer é obter os postos Ou seja a posição que cada valor tá ocupando então o primeiro valor vai receber a posição ou o segundo a posição 2 e assim sucessivamente Então a gente tem aí 15 valores o último valor vai receber a posição 15 tá então coloquei aqui uma coluna com essas posições esses postos Só que tem um detalhe importante aqui se você
observar e com atenção os nossos valores ordenados você vai perceber que número 156 aparece duas vezes e vejo aquele acabou recebendo aí o posto 9 eu posto 10 só que a gente tá falando do mesmo valor não tem como a gente tá em posições diferentes a ele Como que a gente lida com isso o que a gente acaba fazendo é uma média entre os postos Então veja aqueles os 156 como ele apareceu sua duas vezes ele acabou aí o posto 9 e o posto 10 Então se a gente fizer uma média desse expostos a gente
vai chegar aí no valor de nove e meio então o valor real valor que vai ficar aqui como posição do 156 não é nenhum 9 nem o 10 é o nove e meio então a gente vai substituir aqui por nós também tá bom agora vem uma parte que é a gente achar quais postos são de cada grupo tá então vou deixar os postos de guardados aqui no cantinho aí tudo que eu fiz foi separar os grupos para a gente organizar aí qual o posto é de cada grupo Tô começando ali pelo grupo próximo e a
gente tem ali o valor 175 se a gente ficou lá ali da tabela que tá mais à direita a gente vê que 175 ocupa a posição 13 depois eu 170 que na tabela a gente vê que ocupa a posição 12 aí vem o 156 que a gente sabe que ocupa a posição 96 os 144 posto 7181 posto 15 a gente vai fazer a mesma coisa para os outros tá então eu anti-hipertensivo novo 153 posto Oi 138 Posto 5 129 Posto Três 177 Posto 14 116 posto um anti-hipertensivo padrão 142 posto 656/95 122 posto 2 132
posto quatro e 165 posto 11 ok tá tendo visto isso a gente vai agora trabalhar então com esses postos ok que que a gente vai calcular aqui eu até mantive os valores mas a gente vai ficar mente não vai mais olhar para os valores de pressão a gente vai focar nos postos Então a gente vai agora calcular a soma dos postos e para cada grupo e a gente vai também pensar aqui no tamanho de cada grupo que no nosso caso ele tem o mesmo tamanho Mas poderia eu não ter e a partir disso a gente
vai calcular uma estatística do teste de kruskal-wallis que é um valor de H então Vamos por partes a primeira parte do calcular a soma dos postos de cada grupo que você vai ver aí sendo referido nas fórmulas como R com esse pezinho o r vende Hanks né seriam os Poços em inglês E esse vizinho tá indicando que isso vai variar de acordo com o grupo né então o grupo Placebo Grupo anti-hipertensivo Novo grupo anti-hipertensivo o padrão a gente vai ter três valores de R aí para o Placebo se a gente som e esse valor vai
dar 56,5 anti-hipertensivo novo 31 e para o anti-hipertensivo o padrão 32mm E aí a gente vai também anotar o tamanho de cada grupo n né Então nesse caso a gente tem aí três grupos com 5 então 555 Ok fora isso a gente já vai calcular uma coisa que é um passo importante para calcular o HGE eu vou fazer esse cálculo antes para ficar mais simples que a gente vai calcular que a gente vai calcular esse R ao quadrado dividido pelo n do grupo tá então eu vou pegar o R1 por exemplo o grupo Placebo pego
esse 56,5 elevam e só o quadrado e dívida esse resultado pelo ele do grupo que é cinco tá então eu fiz isso para todos os grupos esse cálculo fiz no Excel então a gente chega aí em 63 8,45 ou nove 2,2 e dois 1,25 então a gente tem aí esse valor de soma dos postos ao quadrado dividido pelo ele ok Oi e aí agora a gente vai usar essas informações para calcular uma estatística a gostaria de chamar atenção que nesse caso como os grupos tem o mesmo tamanho a gente nem precisa pensar em média dos
Poços a gente pode olhar para a soma dos postos e dá para perceber que se existe alguma diferença a gente sabe que os valores maiores estão no grupo Placebo porque a soma dos postos desse grupo é maior tá é e dá para perceber que a gente hipertensivo novo e anti-hipertensivo o padrão tem soma dos postos muito parecida provavelmente eles não seriam diferentes e é Lembrando que eu tô olhando aqui para soma dos postos porque esses grupos têm o mesmo tamanho Mas se a gente vai se grupos de tamanhos diferentes a gente faria a média dos
postos que é pegar as suas respostas e dividir por Ele para fazer essa análise que eu fiz beleza bom mas parabéns sem significância estatística nesse esses grupos têm valores ali que diferem estatisticamente a gente tem que calcular estatística do teste de kruskal-wallis que é o valor H Então vou guardar essas informações aqui no cantinho para gente conseguir calcular o nosso valor é h a fórmula do cálculo do valor HS que você vai ver aí na na tela que não é uma fórmula amigável mas ao mesmo tempo ela não é uma forma tão complexa assim tão
pequeno essa forma ou tá dizendo para a gente a gente vai pegar o valor 12 dividir porém vezes animais um o que que seria esse n veja que eu até coloquei com m maiúsculo aí porque se ele é o n total em o caso 5 mais 5 mais 5 15 então seria 12 / 15x 15 mais aí a gente vai multiplicar isso por um somatório que somatório é esse o somatório do R ao quadrado dividido por n tentar por isso que eu já calculei esse pedaço ali tá vendo esse a gente vai somar o 63
8,45 que é esse resultado pelo grupo Placebo com 192, dois que esse resultado para o grupo anti-hipertensivo novo com o 211 1,25 que é esse resultado por grupo diferencia o padrão depois de tudo isso a gente vai subtrair três vezes animais um lembrando aí que aquele é o 15 então substituindo tudo na fórmula a gente fica com esse cálculo do hi12 dividido por 15 vezes 15 mais um X aqueles somatório da última linha ali que a gente calculou menos três vezes 15 mais um e esse resultado o valor aí de 4,0 95 bom então Vamos
guardar esse resultado aí no canto o que a gente parar para pensar insignificância em valor DP a gente precisa considerar mais um detalhezinho que é esse cálculo do H ele não considera uma situação em que a gente tenha empates e no nosso caso a gente tem lembra que tinham ali dois valores iguais então a gente teve que fazer aquele ajuste dos postos né então esse cálculo do H do jeito que tá aí ele é válido para situações em empates no nosso caso como a gente tem impactos a gente vai ter que fazer uma correção em
cima desse valor de H como que vai ser essa correção então a correção para empates que você vai encontrar aí como Tic rektion né porque se Tais é o termo em inglês ela vai ser um menos um somatório de ter Ao Cubo menos ter dividido por ele é o cubo menos em eu sei que ela não parece uma fórmula feliz mas ela vai ser uma coisa tranquila O que que a gente vai fazer aí a gente primeiro precisa retomar e pensa Há muitos impactos a gente tem no nosso caso a gente só tem um valor
de empate uma coisa que se repete Então esse somatório na verdade vai acabar sendo uma coisa só gente nem vai ter que somar veja aqui o nosso valor que tem um empate ele aparece duas vezes então a gente tem um único valor de T que é dois porque a quantidade de vezes que esse valor aparece tem o nosso ter dois para deixar isso bem claro vamos lá Se eu tivesse três valores 156 então o resto fosse igual mas eu tivesse três valores 156 o meu valor de ter seria três certo assim como se eu tivesse
cinco valores 156 meu valor de ter seria 5 e vamos imaginar o outro cenário para ele ficar bem claro imagina que eu tenho dois valores 156 como eu tenho aí mas um outro número por exemplo 132 apareceu três vezes então o que que eu queria nessa situação eu teria dois valores de ter diferentes um valor de ter referente a quantidade de vezes que 156 apareceu dois nesse cenário hipotético e um outro valor de ter referente a quantidade de vezes que o 132 apareceu seria três nesse cenário hipotético que a gente faria uma conta pro ter
dois né que é o do 156 uma conta para o T3 que é o de 132 vezes toma aí esses resultados é daí que vem o somatório da forma no nosso caso só temos dois empates então tudo certo e não é o único valor e ali apresenta em bares Então a gente vai substituir esse te na fórmula da igreja crescerem grandão Aí o ele maiúsculo é o nosso n Total então nosso fator de correção aí vai ser um menos dois é o cubo - 2 / 15 ao cubo menos 15 e aí a gente vai
ficar com um resultado que a 0998 dois cortei umas casas decimais mas é basicamente isso Vamos guardar esse fator de correção aqui e agora sim a gente está pronto para calcular o nosso H corrigido o h corrigido para empates ele vai ser o h é dividida pelo fator de correção Então nesse caso vai ser 4,09 cinco aquele Agar que a gente calculou dividido pelo nosso fator de correção calculado que é 19982 isso vai chegar no valor H corrigido de 4,10 né 10 Oi ok o peixe aqui não é muito diferente ainda mais porque a gente
tinha muito pouco empate né então não tem grandes diferenças do H que a gente calculou inicialmente pagar corrigido mas jogar corrigido tá mais correto é o que os softwares de estatística vão liberar Então a gente vai fazer toda a nossa análise com base nele e outra coisa importante agora para gente começar a pensar em significância estatística é pensar no grau de liberdade esse valor H ele sai com uma distribuição qui-quadrado então pra gente conseguir pensar em significância estatística a gente vai se basear nesse valor de H mas a gente precisa também pensar no grau de
liberdade da distribuição e o grau de liberdade aqui vai ser a quantidade de grupos menos um então no nosso caso a gente tinha ali três grupos menos um a gente tem um grau de liberdade igual a dois vou guardar essas informações que a gente vai usar aulas de jazz e antes da gente usar essas informações e pensar em significância estatística é importante lembrar Quais são as hipóteses do teste kruskal-wallis muitas vezes para simplificar a gente fala assim a a hipótese nula do teste kruskal-wallis é uma igualdade entre as medianas então a hipótese nula seria a
mediana do grupo Placebo é igual a mediana do grupo anti-hipertensivo novo que é igual a mediana do grupo anti-hipertensivo o padrão Só que essa é uma simplificação isso não é bem verdade tá Inclusive a gente pode ter testes que são significativos ele que a gente rejeitar a hipótese nula mesmo quando a mediana é igual porque no fundo que o teste kruskal-wallis está testando não é isso o que está testando é a distribuição tanto é que ele está se baseando ali nas posições nos postos certo então o que que o teste kruskal-wallis está testando a hipótese
nula dele vai ser que os grupos apresentam de e funções iguais se a gente quiser pensar numa medida mais precisa a gente está pensando que os grupos apresentam as mesmas médias dos postos então a média dos postos e ia que aquela soma dividida pelo n do grupo tá enquanto que é Nossa hipótese alternativa vai ser de que há pelo menos uma diferença nas distribuições dos grupos ou ainda há pelo menos uma diferença entre as médias dos pontos Ok como que a gente vai decidir se rejeitar emos ou não a hipótese nula bom falei para você
que o valor H Segue uma distribuição qui-quadrado Então a gente vai pegar esse valor calculado e vai comparar com o valor crítico baseado ali no nosso grau de liberdade se o valor calculado for maior que o valor crítico a gente rejeitar a hipótese nula Tá então vamos atrás desse valor crítico né a gente obtém esses va o desconto não marco mais uma tabela de distribuição qui-quadrado para isso a gente vai ter considerar Qual é o nosso grau de liberdade aí na tabela como degree-of-freedom então nós caso dois vou selecionar e a linha 2 e eu
vou selecionar que a coluna referente ao nosso ponto de corte o nosso nível de significância aqui vou usar o nível de significância padrão de cinco porcento 0,05 e a gente fica então com o valor aí na intersecção que é 5,99 um Então a gente tem aí um valor calculado de que quadrado que é o nosso valor h de 4,10 23 e um valor crítico de 5,99 um é no nosso caso veja que o valor calculado é menor que o valor crítico então a gente não vai rejeitar a hipótese nula a gente vai seguir com ela
e a gente vai considerar que os se apresentam distribuições ali depressão que são estatisticamente iguais Ok é ou ainda que eles apresentam as médias de postos ali que são estatisticamente iguais importante lembrar que a gente tá com ele bem pequenininho Então por mais que pareça ali que os grupos apresentam distribuições diferentes a gente provavelmente não tem poder aí para rejeitar a hipótese nula se basear em tabela é super válido coloquei ali link da da tabela se você quiser olhar a tabela completa com mais grau de liberdade Mas é uma coisa um pouco arcaica eu tenho
um pouco de preguiça de ficar no Brasil na tabela eu prefiro calcular o valor DP e a gente consegue fazer isso usando uma função do Excel Então se a gente quiser calcular o valor de pelo Excel a gente consegue usar essa função aí que chama disse Ponto que quatro pontos CD CD vende cauda direita e aí a gente vai adicionar como argumento desta função primeiramente o valor de H E e o valor de grau de liberdade se a gente fizer esse cálculo a gente chega no pedir zero ficou 129 perceba que mesmo que a gente
calcule o valor de p para tomar decisão a gente acaba chegando na mesma decisão nossos valores de p aí foi maior que nosso nível de significância de 5 por cento e portanto a gente não vai rejeitar a hipótese nula vamos seguir considerando que os grupos apresentam distribuições que são estatisticamente iguais ok é bom gente então era isso que eu tinha para explicar sobre teste de kruskal-wallis Eu espero que você tenha sido útil Então comente se você está gostando desses vídeos teórico de testes estatísticos porque eu tenho me divertido estudando isso mas a regar o saber
se tem público inclusive vou aproveitar para dizer que caso a gente vai ser rejeitada a hipótese nula né ficava aqui com a hipótese alternativa a gente ainda teria que analisar entre quais grupos essa diferença tá aparecendo E para isso ele teria que fazer um teste pós-rock então se você tiver interesse nessa parte do teste pós-rock do kruskal-wallis comenta que a gente faz essa parte manual do pós-rock também mas em softwares estatísticos eu já tenho esse posto Ok tanto na espécie quanto no R Ok então é isso como sempre por favor se você curtiu esse conteúdo
curto os vídeos se inscreva no canal ative notificações comente todo esse engajamento é super me ajudar o canal a crescer e incentivar a continuar produzindo esse tipo de conteúdo para isso eu produz conteúdo de estatística também lá no Instagram no a roupa estatística aplicada até a próxima
Copyright © 2024. Made with ♥ in London by YTScribe.com